栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Pandas:计算整个数据框的均值或标准差(标准差)

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Pandas:计算整个数据框的均值或标准差(标准差)

您可以将数据

stack
框转换为单列(将形状从5x3更改为15x1),然后采用标准偏差:

df.stack().std()         # pandas default degrees of freedom is one

或者,您可以

values
在采用标准差之前使用来将熊猫数据框转换为numpy数组:

df.values.std(ddof=1)    # numpy default degrees of freedom is zero

与pandas不同,numpy默认情况下会给出整个数组的标准差,因此在进行标准差处理之前无需重塑形状。

另外一些注意事项:

  • 这里的numpy方法比熊猫方法要快一些,当您可以选择用numpy或pandas完成相同的事情时,通常情况就是这样。速度差异取决于数据的大小,但是当我在笔记本电脑(numpy版本1.15.4和pandas版本0.23.4)上测试一些不同大小的数据帧时,numpy的速度大约快10倍。

  • 此处的numpy和pandas方法不会给出完全相同的答案,但将非常接近(相同的精度为几位数)。差异是由于在幕后的实现中存在细微差异,这些差异会影响浮点值的取整方式。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/431485.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号