Numpy轴参数axis详解与使用技巧
时间:2025-11-10 17:44:55 238浏览 收藏
NumPy中的`axis`参数是理解多维数组操作的关键。它决定了NumPy函数沿哪个维度执行计算,并“压缩”该维度。例如,`axis=0`表示沿行方向操作,结果行数消失;`axis=1`则沿列方向操作,列数消失。高维数组同理,`axis`指明被“折叠”的维度。理解`axis`的关键在于将其视为被操作并消除的维度,而非简单地与行或列绑定。本文深入解析`axis`参数在不同NumPy函数中的应用,包括聚合函数(如`sum`、`mean`)和维度操作函数(如`concatenate`、`stack`),揭示其在数组重塑、组合和拆分中的作用,助你掌握NumPy数组操作的核心技巧,避免常见误区,提升数据处理效率。
axis参数决定NumPy操作沿哪个维度进行并压缩该维度,axis=0表示沿行方向操作、压缩行维度,结果中行数消失;axis=1表示沿列方向操作、压缩列维度,结果中列数消失;高维同理,axis指明被“折叠”的维度,配合keepdims可保留维度,不同函数中axis含义依操作意图而定。

NumPy中的axis参数,简单来说,就是你告诉NumPy函数,它应该沿着哪个维度去执行操作。它决定了在多维数组上,你的计算(比如求和、求平均、最大值等)是“横着来”还是“竖着来”,或者更抽象地说,是沿着哪个方向“压缩”数据。
解决方案
要真正理解axis,我觉得最好的办法是把它想象成一个“被消除”或者“被折叠”的维度。当你指定axis=0时,NumPy会沿着第一个维度(也就是行,如果你把它看作表格的话)进行操作,然后把这个维度“抹掉”,留下一个维度更少的数组。如果你的数组是二维的,axis=0就是沿着列的方向进行计算,最终结果的行数会减少,甚至只剩一行(或者说,这个维度消失了)。同理,axis=1就是沿着第二个维度(列)进行操作,最终结果的列数会减少。
我个人在刚接触的时候,总是会把axis=0和“行”混淆,觉得它应该作用于行。但实际上,它指的是沿着第一个维度(行)进行操作,然后这个维度会“消失”。比如,一个m x n的矩阵,对axis=0求和,会得到一个长度为n的向量,因为它把m行的数据沿着每一列加起来了。反过来,对axis=1求和,会得到一个长度为m的向量,因为它把n列的数据沿着每一行加起来了。
这对于更高维的数组来说就更有意思了。想象一个三维数组,它有深度、行、列三个维度。axis=0就意味着你会把“深度”这个维度压缩掉,留下一个二维的平面;axis=1就是压缩“行”,留下一个由深度和列组成的平面;axis=2自然就是压缩“列”了。关键在于,你是在告诉NumPy,“请你把数据沿着这个方向整合起来”。
NumPy中axis参数如何影响数组操作?
axis参数对NumPy数组操作的影响是根本性的,它直接决定了输出数组的形状和内容。最直观的例子就是聚合函数,比如np.sum()、np.mean()、np.max()等等。
当我们有一个二维数组 arr = np.array([[1, 2, 3], [4, 5, 6]]):
np.sum(arr):不指定axis,NumPy会把整个数组的所有元素加起来,得到一个标量值(1+2+3+4+5+6 = 21)。这种情况下,你可以认为所有维度都被“压平”了。np.sum(arr, axis=0):这会沿着第一个维度(行)进行求和。它会把[1, 2, 3]和[4, 5, 6]中对应位置的元素相加,结果是[1+4, 2+5, 3+6],也就是[5, 7, 9]。你看,原始数组是(2, 3),结果是(3,),第一个维度消失了。np.sum(arr, axis=1):这会沿着第二个维度(列)进行求和。它会把[1, 2, 3]加起来得到6,把[4, 5, 6]加起来得到15,结果是[6, 15]。原始数组是(2, 3),结果是(2,),第二个维度消失了。
再举个三维的例子,arr_3d = np.arange(1, 28).reshape(3, 3, 3):
arr_3d.sum(axis=0):结果会是一个(3, 3)的数组。它把沿着第一个维度(深度)的3个(3, 3)切片对应位置的元素加起来了。arr_3d.sum(axis=1):结果也会是一个(3, 3)的数组。它把沿着第二个维度(行)的元素加起来。arr_3d.sum(axis=2):结果同样是一个(3, 3)的数组。它把沿着第三个维度(列)的元素加起来。
这里的核心逻辑是,axis参数指向的那个维度,在计算完成后,通常会从结果数组的形状中被移除。如果你希望保留这个被操作的维度,只是让它的大小变为1,可以使用keepdims=True参数,这在进行广播操作时非常有用。
import numpy as np
arr_2d = np.array([[1, 2, 3],
[4, 5, 6]])
print("原始数组:\n", arr_2d)
print("axis=0 求和:", np.sum(arr_2d, axis=0)) # 输出: [5 7 9]
print("axis=1 求和:", np.sum(arr_2d, axis=1)) # 输出: [ 6 15]
print("axis=0 求和并保留维度:", np.sum(arr_2d, axis=0, keepdims=True)) # 输出: [[5 7 9]] (形状 (1, 3))理解NumPy中axis参数的常见误区与实用技巧
我在实际使用中发现,大家对axis参数最常见的误区就是把它和“行/列”这个概念死死绑定。对于二维数组,axis=0对应列操作,axis=1对应行操作,这好像还挺直观。但一旦数组维度超过2,这种简单的映射就失效了,或者说变得不那么直观了。
常见误区:
axis=0总是指行,axis=1总是指列。 这种说法不完全准确。axis=0是第一个维度,axis=1是第二个维度。在Python中,数组的第一个维度通常是“行”的概念(在2D中),但更高维时,它就是最外层的那个“块”或者“层”。axis指的是保留的维度。 恰恰相反,axis通常指的是被操作并被“压缩”或“消除”的那个维度。- 对
axis的理解过于依赖可视化。 我们可以通过二维图来想象,但对于三维甚至更高维,单纯的视觉想象会变得非常困难,甚至误导。
实用技巧:
- “想象维度索引”法: 把数组的
shape看作一个索引列表,比如(d0, d1, d2, ...)。当你指定axis=i时,就是告诉NumPy,对d_i这个维度进行操作,并最终移除它。arr.shape = (3, 4, 5)np.sum(arr, axis=0)结果shape将是(4, 5)。np.sum(arr, axis=1)结果shape将是(3, 5)。np.sum(arr, axis=2)结果shape将是(3, 4)。 记住,axis指向的那个索引位置会从结果的shape中消失。
- 利用
keepdims=True进行广播: 当你对一个维度进行操作后,该维度通常会消失。但在某些情况下,你希望它仍然存在,只是大小变为1,这样可以方便地与原始数组进行广播操作。arr = np.array([[1, 2], [3, 4]]) col_sum = np.sum(arr, axis=0, keepdims=True) # [[4, 6]],形状 (1, 2) # 现在 col_sum 可以直接和 arr 进行广播操作,例如 arr / col_sum print(arr / col_sum) # [[0.25 0.333] # [0.75 0.666]]
如果没有
keepdims=True,np.sum(arr, axis=0)会得到[4, 6],形状是(2,),直接除会报错或得到意想不到的结果,因为广播规则不同。 - 多维度操作:
axis参数也可以接受一个元组,例如axis=(0, 2)。这意味着NumPy会同时沿着第0个和第2个维度进行操作并将其消除。arr_3d = np.arange(1, 28).reshape(3, 3, 3) # 对 axis=0 和 axis=2 同时求和 result = np.sum(arr_3d, axis=(0, 2)) print("arr_3d shape:", arr_3d.shape) # (3, 3, 3) print("sum(axis=(0, 2)) result:", result) # [42 51 60] print("result shape:", result.shape) # (3,) # 原始的 (3, 3, 3) 经过 axis=(0, 2) 聚合,只剩下中间的维度 (3,)这在处理复杂数据时,能让你一次性完成多个维度的聚合,非常高效。
不同NumPy函数对axis参数的处理有何异同?
虽然axis参数的核心概念——指定操作维度并通常消除该维度——在NumPy中是通用的,但不同的函数在处理axis时,其行为的“目的”和“结果”上还是有些微妙的差异。
1. 聚合/归约函数 (Reduction Functions):sum(), mean(), max(), min(), std(), argmax(), argmin() 等
这类函数是axis参数最常见的应用场景。它们的目标是将一个或多个维度的数据聚合、归约成一个更小的结果(通常是标量或维度更少的数组)。
- 共同点:
axis参数指定了要被聚合的维度。这些维度在结果数组的形状中通常会消失。 - 差异点:
argmax()和argmin()返回的是索引,而不是聚合后的值。它们返回的是沿着指定轴上的最大/最小值所在的索引。np.percentile()或np.quantile()允许你指定百分位数,其axis行为与sum()类似。np.apply_along_axis()允许你将任意函数应用到指定轴上,这提供了极大的灵活性,但其内部处理axis的方式也是沿着该轴切片并应用函数。
2. 维度操作函数:concatenate(), stack(), split(), swapaxes(), transpose() 等
这类函数不一定是为了“聚合”数据,而是为了“重塑”、“组合”或“拆分”数组的维度。axis在这里扮演的角色是指定“在哪里”或“如何”进行这些维度操作。
np.concatenate(arrays, axis=0): 沿着一个现有的轴来连接数组。所有数组除了连接轴之外的其他轴的长度必须相同。axis指定的是连接后不改变的那个轴,或者说,连接操作是沿着这个轴进行的。a = np.array([[1, 2], [3, 4]]) # shape (2, 2) b = np.array([[5, 6], [7, 8]]) # shape (2, 2) np.concatenate((a, b), axis=0) # [[1, 2], # [3, 4], # [5, 6], # [7, 8]] # shape (4, 2) - 沿着 axis=0 连接,axis=1 保持不变
np.stack(arrays, axis=0): 与concatenate不同,stack会沿着一个新创建的轴来堆叠数组。axis参数指定新轴插入的位置。a = np.array([1, 2]) # shape (2,) b = np.array([3, 4]) # shape (2,) np.stack((a, b), axis=0) # [[1, 2], # [3, 4]] # shape (2, 2) - 在最前面插入一个新轴 np.stack((a, b), axis=1) # [[1, 3], # [2, 4]] # shape (2, 2) - 在第二个位置插入一个新轴
np.split(ary, indices_or_sections, axis=0): 沿着指定的轴将数组分割成多个子数组。axis指定了分割发生在哪一个维度上。np.swapaxes(arr, axis1, axis2): 这个函数比较特殊,它不是消除维度,而是交换两个指定维度的位置。axis1和axis2就是那两个要被交换的维度索引。np.transpose(arr, axes=None): 这是一个更通用的维度重排函数。当axes=None时,它会反转所有维度的顺序。你也可以提供一个元组来精确指定新维度顺序。
所以,虽然都叫axis,但在不同函数语境下,它可能代表着“要被压缩的维度”、“要进行连接的维度”、“要插入新维度的位置”,或者是“要被交换的维度”。理解其背后操作的“意图”,比死记硬背哪个数字对应哪个方向要重要得多。
今天关于《Numpy轴参数axis详解与使用技巧》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
348 收藏
-
391 收藏
-
324 收藏
-
213 收藏
-
340 收藏
-
292 收藏
-
109 收藏
-
140 收藏
-
447 收藏
-
148 收藏
-
392 收藏
-
423 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习