栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

对Pandas DataFrame进行分组,计算一列的均值和标准差,并使用reset_index将std添加为新列

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

对Pandas DataFrame进行分组,计算一列的均值和标准差,并使用reset_index将std添加为新列

您可以使用以下

groupby-agg
操作:

In [38]: result = df.groupby(['a'], as_index=False).agg({'c':['mean','std'],'b':'first', 'd':'first'})

然后重命名各列并对其重新排序:

In [39]: result.columns = ['a','c','e','b','d']In [40]: result.reindex(columns=sorted(result.columns))Out[40]:         a  b    c  d         e0   Apple  3  4.5  7  0.7071071  Banana  4  4.0  8       NaN2  Cherry  7  1.0  3       NaN

熊猫默认情况下会计算样本std。要计算总体标准:

def pop_std(x):    return x.std(ddof=0)result = df.groupby(['a'], as_index=False).agg({'c':['mean',pop_std],'b':'first', 'd':'first'})result.columns = ['a','c','e','b','d']result.reindex(columns=sorted(result.columns))

产量

        a  b    c  d    e0   Apple  3  4.5  7  0.51  Banana  4  4.0  8  0.02  Cherry  7  1.0  3  0.0


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/611067.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号