PyTorch中`torch.tensor()`和`torch.Tensor()`有何区别？

**常见技术问题：** 在PyTorch中，`torch.tensor()` 和 `torch.Tensor()` 看似功能相似，但存在关键差异：前者是推荐的**构造函数（factory function）**，会根据输入数据自动推断`dtype`和`device`，并默认不继承历史（`requires_grad=False`）；后者是`Tensor`类的**原始构造器**，行为更底层——若传入Python数值或列表，它会使用默认`dtype=torch.float32`且**忽略输入数据类型**（如`torch.tensor([1, 2])` → `int64`张量，而`torch.Tensor([1, 2])` → `float32`张量），易引发静默类型转换错误。此外，`torch.Tensor()` 不支持`dtype`/`device`等显式参数（需配合`.to()`链式调用），且在新版本中已明确标记为“不推荐用于用户代码”。实践中混用可能导致dtype不一致、GPU迁移失败或梯度追踪异常。何时该用哪个？为什么官方文档强调优先使用`torch.tensor()`？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

rememberzrr 2026-04-11 13:50

关注

```html

一、表层现象：语法相似性带来的误用惯性

初学者甚至部分资深工程师常将 torch.tensor() 与 torch.Tensor() 视为等价写法，仅因二者均能创建张量。但实测可见：

import torch
print(torch.tensor([1, 2]).dtype)     # torch.int64
print(torch.Tensor([1, 2]).dtype)      # torch.float32 ← 静默转换！
print(torch.tensor([1.0, 2.0]).dtype)  # torch.float32
print(torch.Tensor([1.0, 2.0]).dtype)  # torch.float32（看似一致，实则机制不同）

这种“看起来都行”的错觉，是大量 dtype 不匹配 bug 的源头。

二、中层机制：构造函数 vs 类构造器的本质差异

从 PyTorch 源码设计视角看：

torch.tensor() 是工厂函数（factory function），封装了类型推断、设备感知、梯度控制等完整语义逻辑；
torch.Tensor() 是底层 C++ Tensor 类的 Python 绑定构造器，直接映射至 ATen 库的 empty() + copy_() 流程，不进行任何输入类型校验或适配。

其行为差异可归纳为下表：

维度	`torch.tensor()`	`torch.Tensor()`
输入类型推断	✅ 自动识别 int/list/float/numpy → 保留原精度	❌ 强制转为 `float32`（标量/列表）或继承 numpy dtype（仅当传入 ndarray）
显式参数支持	✅ `dtype`, `device`, `requires_grad`, `pin_memory`	❌ 仅支持 shape 参数（如 `torch.Tensor(2,3)`），其余需链式调用
梯度追踪默认值	❌ `requires_grad=False`（安全默认）	❌ 同样为 False，但无显式控制入口

三、深层影响：静默错误如何演变为系统性风险

在大规模训练 pipeline 中，混用二者将引发级联失效：

混合精度训练崩塌：torch.Tensor([1,2]) 生成 float32，与模型中定义的 torch.int64 索引张量运算时报错 Expected object of scalar type Long but got Float；
GPU 迁移失败：若先用 torch.Tensor([1,2]) 创建 CPU 张量，再调用 .cuda()，虽可执行，但因未指定 device，无法利用 torch.set_default_device("cuda") 全局策略；
梯度图断裂：当误用 torch.Tensor() 构造中间变量参与计算图（如 loss = (x - torch.Tensor([1.0])).sum()），该节点因非 factory 创建且无 requires_grad=True 显式声明，导致反向传播时梯度无法回传至该常量。

四、工程实践：决策树与迁移路径

以下流程图描述何时选用何者：

graph TD A[创建张量？] --> B{输入来源} B -->|Python 标量/列表/元组| C[必须用 torch.tensor()] B -->|NumPy ndarray| D[推荐 torch.tensor(), 支持 dtype/device 透传] B -->|空张量/占位符| E[torch.empty(), torch.zeros() 等专用 factory] C --> F[可加 dtype=torch.int32, device='cuda', requires_grad=True] D --> G[自动继承 ndarray dtype，可覆盖] E --> H[语义清晰，性能最优] style C fill:#4CAF50,stroke:#388E3C,color:white style F fill:#2196F3,stroke:#1565C0,color:white

五、权威依据与演进脉络

PyTorch 官方自 v1.2 起在文档中明确标注：
“torch.Tensor is a legacy constructor and should not be used in new code. Use torch.tensor instead.”
该建议源于三大技术演进：

统一 API 设计哲学：所有 factory 函数（torch.zeros, torch.ones, torch.full）均遵循 tensor(..., dtype=..., device=...) 模式，torch.tensor 是该范式的基石；
分布式训练兼容性：torch.Tensor() 无法解析 torch.distributed._remote_device 等新设备抽象，而 torch.tensor(..., device="meta") 已原生支持；
编译器栈集成需求：TorchDynamo 和 Inductor 在 tracing 时对 torch.tensor() 做了深度优化，对 torch.Tensor() 则降级为不可追踪操作。

截至 PyTorch 2.4，torch.Tensor 构造器已从用户文档首页移除，仅保留在底层 C++ 接口说明中。

```

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

PyTorch中torch.tensor与torch.Tensor的区别详解
2020-09-16 20:53

在PyTorch中，`torch.tensor` 和 `torch.Tensor` 是两种不同的创建张量（Tensor）的方法，但它们之间的差异并不显著，主要是使用场景和默认属性上的细微差别。这篇文章将详细解析这两者之间的区别。首先，`torch....
pytorch 中 torch.Tensor和 torch.tensor的区别
2021-01-31 15:43

湮尘XJ的博客 Pytorch中，torch.tensor(),torch.Tensor()都用于生成新的张量。 import torch a = torch.tensor([1,2,3]) b = torch.Tensor([1,2,3]) c = torch.FloatTensor([1,2,3]) print(a,b,c) print(a.dtype,b.dtype,c.dtype)...
Pytorch之torch.Tensor()语法、参数和实际应用案例
2025-07-15 23:04

王国平的博客 `torch.Tensor` 是 PyTorch 中最核心的数据结构，用于存储和处理多维数组。它类似于 NumPy 的 `ndarray`，但支持 GPU 加速、自动微分和分布式计算，是深度学习模型构建的基础。
PyTorch中torch.tensor与torch.Tensor的区别
2020-05-17 18:08

Code My Life的博客同样的，在PyTorch中，有一个类似于numpy的库，称为Tensor。Tensor自称为神经网络界的numpy。一、numpy和Tensor二者对比对比项 numpy Tensor 相同点可以定义多维数组，进行切片、改变维...
【pytorch】torch.Tensor详解和常用操作
2020-10-29 17:06

心与道合的博客学习教材：动手学深度学习 PYTORCH 版...在PyTorch中，torch.Tensor是存储和变换数据的主要工具。 Tensor与Numpy的多维数组非常相似。 Tensor还提供了GPU计算和自动求梯度等更多功能，这些使Tensor更适合深度学习。 2
PyTorch框架--torch.Tensor 和 torch.tensor
2024-09-25 19:19

程序员治愈充电站的博客一、 torch.Tensor和torch.tensor的区别首字母大小写区别：torch.Tensor：Tensor是一个类，代表PyTorch底层的张量操作和方法。torch.tensor：tensor是一个函数，用于创建张量对象。默认参数区别：torch.Tensor：使用...
torch.tensor()与torch.Tensor()有何区别？
2025-04-02 16:11

_illusion_的博客 PyTorch 的工厂函数是。
【Pytorch】Pytorch中torch.Tensor和torch.tensor的区别
2022-09-11 20:44

花无凋零之时的博客在Pytorch中，Tensor和tensor都用于生成新的张量。首先我们从根源上来看看和区别。
PyTorch中torch.tensor与torch.Tensor参数详解及异同对比
2023-05-11 09:28

神秘小码农的博客也就是说，torch.Tensor() 的作用实际上跟 torch.FloatTensor() 一样，都是生成一个数据类型为 32 位浮点数的张量，如果没传入数据就返回空张量，如果有列表或者 narray 的返回其对应张量。都会返回一个Tensor类型的...
tensor是pytorch的核心，那torch.tensor和torch.Tensor区别是？
2024-04-20 22:49

人工智能_AI的博客从本节课程开始我们将正式开启pytorch的学习了，在深度学习框架中有一个重要的概念叫做张量，它是pytorch的基本操作单位，要想创建tensor有很多的方式，但是有两个torch.tensor和torch.Tensor容易混淆，本节课程对...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答今天
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月11日