<div id="module-unit-notification-container" hidden=""></div> <p>对于大多数数据集,首先要执行的操作之一是计算数据的汇总统计信息,以便在进一步探索数据之前大致了解数据。 除了数据的和、积、中值、最小值和最大值以及分位数等其他聚合,这些汇总统计信息还包括平均值和标准偏差。</p>
讯享网
NumPy 具有用于处理数组的快速内置聚合函数。 它们是本子节的主题。
可使用内置的 Python 函数对数组中的值进行求和。
讯享网
输出为:
讯享网
如果你猜也有用于此操作的 NumPy 内置函数,那你猜对了:
输出为:
讯享网
如果你猜 NumPy 版本的速度更快,那你又猜对了:
输出为:
讯享网
尽管它们很相似,请记住 和 并不相同。 它们的可选参数具有不同的含义,并且 可感知多个数组维度。
正如 Python 有内置的 和 函数,NumPy 也有类似的向量化版本:
输出为:
讯享网
还可使用 、 和 (以及其他多个 NumPy 聚合)作为数组对象本身的方法:
输出为:
讯享网
通常会将二维数组的行和列区别看待(例如,将列视为变量,将行视为这些变量的观察值)。 因此,通常需要沿行或列来聚合数组数据。 请考虑一个二维数组:
输出为:
讯享网
除非另外指定,否则每个 NumPy 聚合函数都将计算整个数组的聚合。 因此,对于:
输出为:

讯享网
聚合函数采用一个额外的参数,以指定要沿其计算聚合的轴。 例如,可通过指定 来查找每个列中的最小值:
输出为:
讯享网
尝试 时,会出现什么情况?
提示(展开以显示)
输出为:
讯享网
请记住, 关键字指定要折叠的数组维度,而不是将返回的维度。 因此,如果指定 ,则将折叠第一个轴。 对于二维数组,这意味着将聚合每个列中的值。
下表列出了其他 NumPy 聚合函数。 大多数 NumPy 聚合具有“-safe”版本,它会计算结果,同时忽略由 值标记的缺失值。
在本课程的其余部分,我们将经常看到这些聚合。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/202809.html