首页 > 文章 > python教程

Numpy轴参数axis详解与使用技巧

时间：2025-11-10 17:44:55 238浏览收藏

NumPy中的`axis`参数是理解多维数组操作的关键。它决定了NumPy函数沿哪个维度执行计算，并“压缩”该维度。例如，`axis=0`表示沿行方向操作，结果行数消失；`axis=1`则沿列方向操作，列数消失。高维数组同理，`axis`指明被“折叠”的维度。理解`axis`的关键在于将其视为被操作并消除的维度，而非简单地与行或列绑定。本文深入解析`axis`参数在不同NumPy函数中的应用，包括聚合函数（如`sum`、`mean`）和维度操作函数（如`concatenate`、`stack`），揭示其在数组重塑、组合和拆分中的作用，助你掌握NumPy数组操作的核心技巧，避免常见误区，提升数据处理效率。

axis参数决定NumPy操作沿哪个维度进行并压缩该维度，axis=0表示沿行方向操作、压缩行维度，结果中行数消失；axis=1表示沿列方向操作、压缩列维度，结果中列数消失；高维同理，axis指明被“折叠”的维度，配合keepdims可保留维度，不同函数中axis含义依操作意图而定。

python numpy中的axis是什么意思_numpy中axis轴参数的含义与用法解析

NumPy中的axis参数，简单来说，就是你告诉NumPy函数，它应该沿着哪个维度去执行操作。它决定了在多维数组上，你的计算（比如求和、求平均、最大值等）是“横着来”还是“竖着来”，或者更抽象地说，是沿着哪个方向“压缩”数据。

解决方案

要真正理解axis，我觉得最好的办法是把它想象成一个“被消除”或者“被折叠”的维度。当你指定axis=0时，NumPy会沿着第一个维度（也就是行，如果你把它看作表格的话）进行操作，然后把这个维度“抹掉”，留下一个维度更少的数组。如果你的数组是二维的，axis=0就是沿着列的方向进行计算，最终结果的行数会减少，甚至只剩一行（或者说，这个维度消失了）。同理，axis=1就是沿着第二个维度（列）进行操作，最终结果的列数会减少。

我个人在刚接触的时候，总是会把axis=0和“行”混淆，觉得它应该作用于行。但实际上，它指的是沿着第一个维度（行）进行操作，然后这个维度会“消失”。比如，一个m x n的矩阵，对axis=0求和，会得到一个长度为n的向量，因为它把m行的数据沿着每一列加起来了。反过来，对axis=1求和，会得到一个长度为m的向量，因为它把n列的数据沿着每一行加起来了。

这对于更高维的数组来说就更有意思了。想象一个三维数组，它有深度、行、列三个维度。axis=0就意味着你会把“深度”这个维度压缩掉，留下一个二维的平面；axis=1就是压缩“行”，留下一个由深度和列组成的平面；axis=2自然就是压缩“列”了。关键在于，你是在告诉NumPy，“请你把数据沿着这个方向整合起来”。

NumPy中axis参数如何影响数组操作？

axis参数对NumPy数组操作的影响是根本性的，它直接决定了输出数组的形状和内容。最直观的例子就是聚合函数，比如np.sum()、np.mean()、np.max()等等。

当我们有一个二维数组 arr = np.array([[1, 2, 3], [4, 5, 6]])：

np.sum(arr)：不指定axis，NumPy会把整个数组的所有元素加起来，得到一个标量值（1+2+3+4+5+6 = 21）。这种情况下，你可以认为所有维度都被“压平”了。
np.sum(arr, axis=0)：这会沿着第一个维度（行）进行求和。它会把[1, 2, 3]和[4, 5, 6]中对应位置的元素相加，结果是[1+4, 2+5, 3+6]，也就是[5, 7, 9]。你看，原始数组是 (2, 3)，结果是 (3,)，第一个维度消失了。
np.sum(arr, axis=1)：这会沿着第二个维度（列）进行求和。它会把[1, 2, 3]加起来得到6，把[4, 5, 6]加起来得到15，结果是[6, 15]。原始数组是 (2, 3)，结果是 (2,)，第二个维度消失了。

再举个三维的例子，arr_3d = np.arange(1, 28).reshape(3, 3, 3)：

arr_3d.sum(axis=0)：结果会是一个 (3, 3) 的数组。它把沿着第一个维度（深度）的3个 (3, 3) 切片对应位置的元素加起来了。
arr_3d.sum(axis=1)：结果也会是一个 (3, 3) 的数组。它把沿着第二个维度（行）的元素加起来。
arr_3d.sum(axis=2)：结果同样是一个 (3, 3) 的数组。它把沿着第三个维度（列）的元素加起来。

这里的核心逻辑是，axis参数指向的那个维度，在计算完成后，通常会从结果数组的形状中被移除。如果你希望保留这个被操作的维度，只是让它的大小变为1，可以使用keepdims=True参数，这在进行广播操作时非常有用。

import numpy as np

arr_2d = np.array([[1, 2, 3],
                   [4, 5, 6]])

print("原始数组:\n", arr_2d)
print("axis=0 求和:", np.sum(arr_2d, axis=0)) # 输出: [5 7 9]
print("axis=1 求和:", np.sum(arr_2d, axis=1)) # 输出: [ 6 15]
print("axis=0 求和并保留维度:", np.sum(arr_2d, axis=0, keepdims=True)) # 输出: [[5 7 9]] (形状 (1, 3))

理解NumPy中axis参数的常见误区与实用技巧

我在实际使用中发现，大家对axis参数最常见的误区就是把它和“行/列”这个概念死死绑定。对于二维数组，axis=0对应列操作，axis=1对应行操作，这好像还挺直观。但一旦数组维度超过2，这种简单的映射就失效了，或者说变得不那么直观了。

常见误区：

axis=0总是指行，axis=1总是指列。 这种说法不完全准确。axis=0是第一个维度，axis=1是第二个维度。在Python中，数组的第一个维度通常是“行”的概念（在2D中），但更高维时，它就是最外层的那个“块”或者“层”。
axis指的是保留的维度。 恰恰相反，axis通常指的是被操作并被“压缩”或“消除”的那个维度。
对axis的理解过于依赖可视化。 我们可以通过二维图来想象，但对于三维甚至更高维，单纯的视觉想象会变得非常困难，甚至误导。

实用技巧：

“想象维度索引”法： 把数组的shape看作一个索引列表，比如 (d0, d1, d2, ...)。当你指定axis=i时，就是告诉NumPy，对d_i这个维度进行操作，并最终移除它。
- arr.shape = (3, 4, 5)
- np.sum(arr, axis=0) 结果 shape 将是 (4, 5)。
- np.sum(arr, axis=1) 结果 shape 将是 (3, 5)。
- np.sum(arr, axis=2) 结果 shape 将是 (3, 4)。记住，axis指向的那个索引位置会从结果的shape中消失。
利用keepdims=True进行广播： 当你对一个维度进行操作后，该维度通常会消失。但在某些情况下，你希望它仍然存在，只是大小变为1，这样可以方便地与原始数组进行广播操作。
```
arr = np.array([[1, 2], [3, 4]])
col_sum = np.sum(arr, axis=0, keepdims=True) # [[4, 6]]，形状 (1, 2)
# 现在 col_sum 可以直接和 arr 进行广播操作，例如 arr / col_sum
print(arr / col_sum)
# [[0.25 0.333]
#  [0.75 0.666]]
```
如果没有keepdims=True，np.sum(arr, axis=0)会得到[4, 6]，形状是(2,)，直接除会报错或得到意想不到的结果，因为广播规则不同。

多维度操作： axis参数也可以接受一个元组，例如 axis=(0, 2)。这意味着NumPy会同时沿着第0个和第2个维度进行操作并将其消除。

arr_3d = np.arange(1, 28).reshape(3, 3, 3)
# 对 axis=0 和 axis=2 同时求和
result = np.sum(arr_3d, axis=(0, 2))
print("arr_3d shape:", arr_3d.shape) # (3, 3, 3)
print("sum(axis=(0, 2)) result:", result) # [42 51 60]
print("result shape:", result.shape) # (3,)
# 原始的 (3, 3, 3) 经过 axis=(0, 2) 聚合，只剩下中间的维度 (3,)

这在处理复杂数据时，能让你一次性完成多个维度的聚合，非常高效。

不同NumPy函数对axis参数的处理有何异同？

虽然axis参数的核心概念——指定操作维度并通常消除该维度——在NumPy中是通用的，但不同的函数在处理axis时，其行为的“目的”和“结果”上还是有些微妙的差异。

1. 聚合/归约函数 (Reduction Functions)：sum(), mean(), max(), min(), std(), argmax(), argmin() 等 这类函数是axis参数最常见的应用场景。它们的目标是将一个或多个维度的数据聚合、归约成一个更小的结果（通常是标量或维度更少的数组）。

共同点： axis参数指定了要被聚合的维度。这些维度在结果数组的形状中通常会消失。
差异点：
- argmax() 和 argmin() 返回的是索引，而不是聚合后的值。它们返回的是沿着指定轴上的最大/最小值所在的索引。
- np.percentile() 或 np.quantile() 允许你指定百分位数，其axis行为与sum()类似。
- np.apply_along_axis() 允许你将任意函数应用到指定轴上，这提供了极大的灵活性，但其内部处理axis的方式也是沿着该轴切片并应用函数。

2. 维度操作函数：concatenate(), stack(), split(), swapaxes(), transpose() 等 这类函数不一定是为了“聚合”数据，而是为了“重塑”、“组合”或“拆分”数组的维度。axis在这里扮演的角色是指定“在哪里”或“如何”进行这些维度操作。

np.concatenate(arrays, axis=0)： 沿着一个现有的轴来连接数组。所有数组除了连接轴之外的其他轴的长度必须相同。axis指定的是连接后不改变的那个轴，或者说，连接操作是沿着这个轴进行的。
```
a = np.array([[1, 2], [3, 4]]) # shape (2, 2)
b = np.array([[5, 6], [7, 8]]) # shape (2, 2)
np.concatenate((a, b), axis=0)
# [[1, 2],
#  [3, 4],
#  [5, 6],
#  [7, 8]]  # shape (4, 2) - 沿着 axis=0 连接，axis=1 保持不变
```

np.stack(arrays, axis=0)： 与concatenate不同，stack会沿着一个新创建的轴来堆叠数组。axis参数指定新轴插入的位置。

a = np.array([1, 2]) # shape (2,)
b = np.array([3, 4]) # shape (2,)
np.stack((a, b), axis=0)
# [[1, 2],
#  [3, 4]] # shape (2, 2) - 在最前面插入一个新轴
np.stack((a, b), axis=1)
# [[1, 3],
#  [2, 4]] # shape (2, 2) - 在第二个位置插入一个新轴

np.split(ary, indices_or_sections, axis=0)： 沿着指定的轴将数组分割成多个子数组。axis指定了分割发生在哪一个维度上。
np.swapaxes(arr, axis1, axis2)： 这个函数比较特殊，它不是消除维度，而是交换两个指定维度的位置。axis1和axis2就是那两个要被交换的维度索引。
np.transpose(arr, axes=None)： 这是一个更通用的维度重排函数。当axes=None时，它会反转所有维度的顺序。你也可以提供一个元组来精确指定新维度顺序。

所以，虽然都叫axis，但在不同函数语境下，它可能代表着“要被压缩的维度”、“要进行连接的维度”、“要插入新维度的位置”，或者是“要被交换的维度”。理解其背后操作的“意图”，比死记硬背哪个数字对应哪个方向要重要得多。

今天关于《Numpy轴参数axis详解与使用技巧》的内容介绍就到此结束，如果有什么疑问或者建议，可以在golang学习网公众号下多多回复交流；文中若有不正之处，也希望回复留言以告知！

Numpy 聚合函数数组操作维度 axis参数

资料下载

编程学习资料下载

精选编程（Golang、Python、Java、C++、JavaScript等）教程、电子书与示例源码，一键打包本地下载学习。

立即下载