PyTorch广播与矩阵乘法教程
时间:2026-01-02 12:12:39 352浏览 收藏
你在学习文章相关的知识吗?本文《PyTorch 广播与矩阵乘法详解》,主要介绍的内容就涉及到,如果你想提升自己的开发能力,就不要错过这篇文章,大家要知道编程理论基础和实战操作都是不可或缺的哦!

本文澄清 PyTorch 中广播(broadcasting)与矩阵乘法(`matmul`)的本质区别:广播不适用于形状不兼容的逐元素运算(如 `+`),而 `X @ Y` 或 `torch.matmul(X, Y)` 才是正确执行 2×4 与 4×2 矩阵乘法的方式。
在 PyTorch 中,初学者常将「形状满足矩阵乘法条件」与「支持广播运算」混淆。实际上,二者遵循完全不同的规则:
*逐元素运算(如 +, -, `,/)依赖广播机制**:要求张量在每个维度上满足广播兼容性——即从尾部维度开始比对,任一维度为1或两维度相等,才能自动扩展。 例如:X.shape = (2, 4)与Y.shape = (4, 2)**无法广播**,因为最后维度4 ≠ 2,倒数第二维2 ≠ 4,且无维度为1可触发扩展。因此X + Y` 报错:
RuntimeError: The size of tensor a (4) must match the size of tensor b (2) at non-singleton dimension 1
这明确指出:第 1 维(0-indexed)尺寸不匹配,且均非 1,广播失败。
矩阵乘法(@ 或 torch.matmul)不依赖广播,而是遵循线性代数规则:只要 X 的最后一维等于 Y 的倒数第二维(即 X.shape[-1] == Y.shape[-2]),即可计算。本例中 X 为 (2, 4),Y 为 (4, 2),满足 4 == 4,结果为 (2, 2):
import torch X = torch.tensor([[1,5,2,7], [8,2,5,3]]) # shape: (2, 4) Y = torch.tensor([[2,9], [11,4], [9,2], [22,7]]) # shape: (4, 2) result = torch.matmul(X, Y) # 或 X @ Y print(result) # 输出: # tensor([[229, 82], # [149, 111]])
⚠️ 注意:torch.mm() 仅支持 2D 张量,而 torch.matmul() 支持高维批量矩阵乘(如 (b, m, k) @ (b, k, n) → (b, m, n)),并可在必要时对缺失的 batch 维度进行隐式广播(如将 (2,4) 视为 (1,2,4) 与 (4,2) 相乘)。但这种广播是 matmul 内部行为,不改变逐元素运算的广播规则。
✅ 正确实践建议:
- 需逐元素运算?先确保形状兼容或显式 unsqueeze()/expand();
- 需矩阵乘法?直接用 @ 或 torch.matmul(),无需手动调整形状;
- 调试时善用 .shape 和 torch.broadcast_shapes()(PyTorch 2.0+)验证广播可行性。
归根结底:广播不是“万能适配器”,而是有严格维度对齐规则的逐元素操作机制;而矩阵乘法是独立的、基于线性代数定义的运算——二者不可混为一谈。
文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《PyTorch广播与矩阵乘法教程》文章吧,也可关注golang学习网公众号了解相关技术文章。
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
101 收藏
-
465 收藏
-
467 收藏
-
283 收藏
-
283 收藏
-
185 收藏
-
364 收藏
-
294 收藏
-
189 收藏
-
220 收藏
-
451 收藏
-
147 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习