”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 如何在 NumPy 中高效地选择每行的特定列索引?

如何在 NumPy 中高效地选择每行的特定列索引?

发布于2024-11-01
浏览:939

How to Efficiently Select Specific Column Indexes per Row in NumPy?

NumPy:高效选择每行特定列索引

数据选择是数据分析中至关重要的操作。使用 NumPy 数组时,从每行中选择特定列可能是一项常见任务。此选择可以通过多种方法完成,但根据每行的索引列表选择列需要更有效的方法。

使用布尔数组进行直接选择

如果您有一个布尔数组来指示要选择的列,则可以使用直接选择来有效地提取所需的值。可以通过将索引列表与列范围进行比较来创建布尔数组。例如,给定问题中所述的矩阵 X 和索引 Y 列表,您可以创建一个布尔数组 b,如下所示:

import numpy as np

X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
Y = np.array([1, 0, 2])
b = np.arange(X.shape[1])[np.isin(np.arange(X.shape[1]), Y)]

有了布尔数组b,可以直接选择:

result = X[np.arange(X.shape[0]), b]

此方法提供了一种基于布尔数组选择特定列的快速方法。

替代方法

或者,您可以使用 np.arange 并根据索引列表 Y 直接选择。此方法涉及创建索引数组并从矩阵 X 相应:

result = X[np.arange(X.shape[0]), Y]

结论

使用布尔数组可以有效地在 NumPy 中选择每行的特定列索引。此方法提供基于索引列表的快速、直接的列选择。对于大量数据,这种方法将比基于迭代的方法提供显着的性能优势。

最新教程 更多>

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3