NumPy快速生成对角矩阵,np.diag使用技巧
时间:2026-04-05 08:47:23 383浏览 收藏
本文深入解析了NumPy中`np.diag()`函数的核心用法与常见陷阱:它既能将一维数组高效生成对角矩阵,也能从二维数组中提取主对角线元素,但行为随输入维度截然不同——误传二维数组极易导致意外结果;通过`k`参数可灵活控制对角线偏移,而`dtype`需显式指定以防类型隐式升级;相比而言,`np.diagflat()`更具鲁棒性,能自动展平任意嵌套结构再构对角阵;更重要的是,面对大规模数据时,应避免显式构造稠密对角矩阵,转而利用一维对角向量配合向量化运算(如逐行缩放、直接取倒数)以大幅提升性能并节省内存——掌握这些技巧,才能真正用好NumPy的对角操作。

用 np.diag() 从一维数组生成对角矩阵
直接传入一维数组,np.diag() 就会把它铺到主对角线上,其余位置自动填 0。这是最常用、也最不容易出错的生成方式。
常见错误是误传二维数组——比如想用 [1,2,3] 生成 3×3 对角阵,却写了 np.diag([[1,2,3]]),结果得到的是 1×1 矩阵(因为 np.diag() 对二维输入默认提取主对角线)。
- 正确写法:
np.diag([1, 2, 3])→ 返回 shape=(3, 3) 的对角矩阵 - 如果需要指定偏移量(比如上/下一条对角线),加
k参数:np.diag([1,2], k=1)把数组放在第一超对角线 dtype不会自动继承原数组类型:np.diag([1,2], dtype=np.float32)才能得到 float32 类型结果,否则默认是 int64 或 float64
用 np.diag() 提取二维数组的对角线
传入二维数组时,np.diag() 行为完全相反:它不生成矩阵,而是抽出主对角线元素,返回一维 ndarray。
容易踩的坑是以为它能“提取任意对角线”或“保持二维形状”。实际上它只抽元素,不保留维度;而且对非方阵也有效(比如 4×3 矩阵会抽前 3 个对角元)。
- 输入
np.array([[1,2,3],[4,5,6]])→ 输出[1, 5](长度为 min(2,3)=2) - 想抽第 k 条对角线?同样用
k参数:np.diag(arr, k=-1)抽次对角线 - 注意:提取操作不检查输入是否为
ndarray,但若传入 Python list 嵌套,会先尝试转成数组,可能隐式触发类型转换
np.diagflat() 和 np.diag() 的关键区别
当输入不是严格一维(比如嵌套 list、多维数组、标量),np.diagflat() 会先把它展平成一维,再铺成对角矩阵;而 np.diag() 遇到非一维输入就直接提取对角线。
这个差异在处理用户输入或中间计算结果时特别关键——你不确定数据维度时,np.diagflat() 更鲁棒。
np.diag([[1,2]])→[1](提取对角线)np.diagflat([[1,2]])→[[1,0],[0,2]](先展平成[1,2],再生成对角阵)np.diagflat(5)→[[5]](标量也被接受)- 性能上,
np.diagflat()多一次展平开销,但对小数组可忽略
生成大对角矩阵时的内存与类型陷阱
用 np.diag() 生成大型对角阵(比如 size=10000)看似方便,但实际会分配完整 (n,n) 内存,不是稀疏结构。如果你后续只做向量乘法或求逆,这很浪费。
真正该用对角矩阵的场景,往往该换思路:用一维数组 + 专用函数代替显式构造二维阵。
- 矩阵乘法:
diag_vec * X.T(逐行缩放)比np.diag(diag_vec) @ X快一个数量级且省内存 - 求逆:直接
1 / diag_vec,别算np.linalg.inv(np.diag(...)) - 如果必须传给要求
ndarray的库(如某些 SciPy 函数),再考虑np.diag(),否则优先保持一维形式
类型方面,整数数组生成的对角阵默认是 int64,但参与浮点运算时会悄悄提升类型;如果确定全程用 float,初始化就用 np.diag(np.float32([1,2,3])),避免隐式复制和类型推导开销。
本篇关于《NumPy快速生成对角矩阵,np.diag使用技巧》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于文章的相关知识,请关注golang学习网公众号!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
108 收藏
-
209 收藏
-
120 收藏
-
145 收藏
-
122 收藏
-
362 收藏
-
173 收藏
-
121 收藏
-
281 收藏
-
173 收藏
-
105 收藏
-
106 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习