登录
首页 >  文章 >  python教程

Numpy轴参数axis详解与使用技巧

时间:2025-11-10 17:44:55 238浏览 收藏

NumPy中的`axis`参数是理解多维数组操作的关键。它决定了NumPy函数沿哪个维度执行计算,并“压缩”该维度。例如,`axis=0`表示沿行方向操作,结果行数消失;`axis=1`则沿列方向操作,列数消失。高维数组同理,`axis`指明被“折叠”的维度。理解`axis`的关键在于将其视为被操作并消除的维度,而非简单地与行或列绑定。本文深入解析`axis`参数在不同NumPy函数中的应用,包括聚合函数(如`sum`、`mean`)和维度操作函数(如`concatenate`、`stack`),揭示其在数组重塑、组合和拆分中的作用,助你掌握NumPy数组操作的核心技巧,避免常见误区,提升数据处理效率。

axis参数决定NumPy操作沿哪个维度进行并压缩该维度,axis=0表示沿行方向操作、压缩行维度,结果中行数消失;axis=1表示沿列方向操作、压缩列维度,结果中列数消失;高维同理,axis指明被“折叠”的维度,配合keepdims可保留维度,不同函数中axis含义依操作意图而定。

python numpy中的axis是什么意思_numpy中axis轴参数的含义与用法解析

NumPy中的axis参数,简单来说,就是你告诉NumPy函数,它应该沿着哪个维度去执行操作。它决定了在多维数组上,你的计算(比如求和、求平均、最大值等)是“横着来”还是“竖着来”,或者更抽象地说,是沿着哪个方向“压缩”数据。

解决方案

要真正理解axis,我觉得最好的办法是把它想象成一个“被消除”或者“被折叠”的维度。当你指定axis=0时,NumPy会沿着第一个维度(也就是行,如果你把它看作表格的话)进行操作,然后把这个维度“抹掉”,留下一个维度更少的数组。如果你的数组是二维的,axis=0就是沿着列的方向进行计算,最终结果的行数会减少,甚至只剩一行(或者说,这个维度消失了)。同理,axis=1就是沿着第二个维度(列)进行操作,最终结果的列数会减少。

我个人在刚接触的时候,总是会把axis=0和“行”混淆,觉得它应该作用于行。但实际上,它指的是沿着第一个维度(行)进行操作,然后这个维度会“消失”。比如,一个m x n的矩阵,对axis=0求和,会得到一个长度为n的向量,因为它把m行的数据沿着每一列加起来了。反过来,对axis=1求和,会得到一个长度为m的向量,因为它把n列的数据沿着每一行加起来了。

这对于更高维的数组来说就更有意思了。想象一个三维数组,它有深度、行、列三个维度。axis=0就意味着你会把“深度”这个维度压缩掉,留下一个二维的平面;axis=1就是压缩“行”,留下一个由深度和列组成的平面;axis=2自然就是压缩“列”了。关键在于,你是在告诉NumPy,“请你把数据沿着这个方向整合起来”。

NumPy中axis参数如何影响数组操作?

axis参数对NumPy数组操作的影响是根本性的,它直接决定了输出数组的形状和内容。最直观的例子就是聚合函数,比如np.sum()np.mean()np.max()等等。

当我们有一个二维数组 arr = np.array([[1, 2, 3], [4, 5, 6]])

  • np.sum(arr):不指定axis,NumPy会把整个数组的所有元素加起来,得到一个标量值(1+2+3+4+5+6 = 21)。这种情况下,你可以认为所有维度都被“压平”了。
  • np.sum(arr, axis=0):这会沿着第一个维度(行)进行求和。它会把[1, 2, 3][4, 5, 6]中对应位置的元素相加,结果是[1+4, 2+5, 3+6],也就是[5, 7, 9]。你看,原始数组是 (2, 3),结果是 (3,),第一个维度消失了。
  • np.sum(arr, axis=1):这会沿着第二个维度(列)进行求和。它会把[1, 2, 3]加起来得到6,把[4, 5, 6]加起来得到15,结果是[6, 15]。原始数组是 (2, 3),结果是 (2,),第二个维度消失了。

再举个三维的例子,arr_3d = np.arange(1, 28).reshape(3, 3, 3)

  • arr_3d.sum(axis=0):结果会是一个 (3, 3) 的数组。它把沿着第一个维度(深度)的3个 (3, 3) 切片对应位置的元素加起来了。
  • arr_3d.sum(axis=1):结果也会是一个 (3, 3) 的数组。它把沿着第二个维度(行)的元素加起来。
  • arr_3d.sum(axis=2):结果同样是一个 (3, 3) 的数组。它把沿着第三个维度(列)的元素加起来。

这里的核心逻辑是,axis参数指向的那个维度,在计算完成后,通常会从结果数组的形状中被移除。如果你希望保留这个被操作的维度,只是让它的大小变为1,可以使用keepdims=True参数,这在进行广播操作时非常有用。

import numpy as np

arr_2d = np.array([[1, 2, 3],
                   [4, 5, 6]])

print("原始数组:\n", arr_2d)
print("axis=0 求和:", np.sum(arr_2d, axis=0)) # 输出: [5 7 9]
print("axis=1 求和:", np.sum(arr_2d, axis=1)) # 输出: [ 6 15]
print("axis=0 求和并保留维度:", np.sum(arr_2d, axis=0, keepdims=True)) # 输出: [[5 7 9]] (形状 (1, 3))

理解NumPy中axis参数的常见误区与实用技巧

我在实际使用中发现,大家对axis参数最常见的误区就是把它和“行/列”这个概念死死绑定。对于二维数组,axis=0对应列操作,axis=1对应行操作,这好像还挺直观。但一旦数组维度超过2,这种简单的映射就失效了,或者说变得不那么直观了。

常见误区:

  1. axis=0总是指行,axis=1总是指列。 这种说法不完全准确。axis=0是第一个维度,axis=1是第二个维度。在Python中,数组的第一个维度通常是“行”的概念(在2D中),但更高维时,它就是最外层的那个“块”或者“层”。
  2. axis指的是保留的维度。 恰恰相反,axis通常指的是被操作并被“压缩”或“消除”的那个维度。
  3. axis的理解过于依赖可视化。 我们可以通过二维图来想象,但对于三维甚至更高维,单纯的视觉想象会变得非常困难,甚至误导。

实用技巧:

  1. “想象维度索引”法: 把数组的shape看作一个索引列表,比如 (d0, d1, d2, ...)。当你指定axis=i时,就是告诉NumPy,对d_i这个维度进行操作,并最终移除它。
    • arr.shape = (3, 4, 5)
    • np.sum(arr, axis=0) 结果 shape 将是 (4, 5)
    • np.sum(arr, axis=1) 结果 shape 将是 (3, 5)
    • np.sum(arr, axis=2) 结果 shape 将是 (3, 4)。 记住,axis指向的那个索引位置会从结果的shape中消失。
  2. 利用keepdims=True进行广播: 当你对一个维度进行操作后,该维度通常会消失。但在某些情况下,你希望它仍然存在,只是大小变为1,这样可以方便地与原始数组进行广播操作。
    arr = np.array([[1, 2], [3, 4]])
    col_sum = np.sum(arr, axis=0, keepdims=True) # [[4, 6]],形状 (1, 2)
    # 现在 col_sum 可以直接和 arr 进行广播操作,例如 arr / col_sum
    print(arr / col_sum)
    # [[0.25 0.333]
    #  [0.75 0.666]]

    如果没有keepdims=Truenp.sum(arr, axis=0)会得到[4, 6],形状是(2,),直接除会报错或得到意想不到的结果,因为广播规则不同。

  3. 多维度操作: axis参数也可以接受一个元组,例如 axis=(0, 2)。这意味着NumPy会同时沿着第0个和第2个维度进行操作并将其消除。
    arr_3d = np.arange(1, 28).reshape(3, 3, 3)
    # 对 axis=0 和 axis=2 同时求和
    result = np.sum(arr_3d, axis=(0, 2))
    print("arr_3d shape:", arr_3d.shape) # (3, 3, 3)
    print("sum(axis=(0, 2)) result:", result) # [42 51 60]
    print("result shape:", result.shape) # (3,)
    # 原始的 (3, 3, 3) 经过 axis=(0, 2) 聚合,只剩下中间的维度 (3,)

    这在处理复杂数据时,能让你一次性完成多个维度的聚合,非常高效。

不同NumPy函数对axis参数的处理有何异同?

虽然axis参数的核心概念——指定操作维度并通常消除该维度——在NumPy中是通用的,但不同的函数在处理axis时,其行为的“目的”和“结果”上还是有些微妙的差异。

1. 聚合/归约函数 (Reduction Functions):sum(), mean(), max(), min(), std(), argmax(), argmin() 这类函数是axis参数最常见的应用场景。它们的目标是将一个或多个维度的数据聚合、归约成一个更小的结果(通常是标量或维度更少的数组)。

  • 共同点: axis参数指定了要被聚合的维度。这些维度在结果数组的形状中通常会消失。
  • 差异点:
    • argmax()argmin() 返回的是索引,而不是聚合后的值。它们返回的是沿着指定轴上的最大/最小值所在的索引。
    • np.percentile()np.quantile() 允许你指定百分位数,其axis行为与sum()类似。
    • np.apply_along_axis() 允许你将任意函数应用到指定轴上,这提供了极大的灵活性,但其内部处理axis的方式也是沿着该轴切片并应用函数。

2. 维度操作函数:concatenate(), stack(), split(), swapaxes(), transpose() 这类函数不一定是为了“聚合”数据,而是为了“重塑”、“组合”或“拆分”数组的维度。axis在这里扮演的角色是指定“在哪里”或“如何”进行这些维度操作。

  • np.concatenate(arrays, axis=0) 沿着一个现有的轴来连接数组。所有数组除了连接轴之外的其他轴的长度必须相同。axis指定的是连接后不改变的那个轴,或者说,连接操作是沿着这个轴进行的。
    a = np.array([[1, 2], [3, 4]]) # shape (2, 2)
    b = np.array([[5, 6], [7, 8]]) # shape (2, 2)
    np.concatenate((a, b), axis=0)
    # [[1, 2],
    #  [3, 4],
    #  [5, 6],
    #  [7, 8]]  # shape (4, 2) - 沿着 axis=0 连接,axis=1 保持不变
  • np.stack(arrays, axis=0)concatenate不同,stack会沿着一个新创建的轴来堆叠数组。axis参数指定新轴插入的位置。
    a = np.array([1, 2]) # shape (2,)
    b = np.array([3, 4]) # shape (2,)
    np.stack((a, b), axis=0)
    # [[1, 2],
    #  [3, 4]] # shape (2, 2) - 在最前面插入一个新轴
    np.stack((a, b), axis=1)
    # [[1, 3],
    #  [2, 4]] # shape (2, 2) - 在第二个位置插入一个新轴
  • np.split(ary, indices_or_sections, axis=0) 沿着指定的轴将数组分割成多个子数组。axis指定了分割发生在哪一个维度上。
  • np.swapaxes(arr, axis1, axis2) 这个函数比较特殊,它不是消除维度,而是交换两个指定维度的位置。axis1axis2就是那两个要被交换的维度索引。
  • np.transpose(arr, axes=None) 这是一个更通用的维度重排函数。当axes=None时,它会反转所有维度的顺序。你也可以提供一个元组来精确指定新维度顺序。

所以,虽然都叫axis,但在不同函数语境下,它可能代表着“要被压缩的维度”、“要进行连接的维度”、“要插入新维度的位置”,或者是“要被交换的维度”。理解其背后操作的“意图”,比死记硬背哪个数字对应哪个方向要重要得多。

今天关于《Numpy轴参数axis详解与使用技巧》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>