栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

pandas数据框:如何将describe()应用于每个组并添加到新列?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

pandas数据框:如何将describe()应用于每个组并添加到新列?

定义一些数据

In[1]:import pandas as pdimport iodata = """name scoreA      1A      2A      3A      4A      5B      2B      4B      6B      8    """df = pd.read_csv(io.StringIO(data), delimiter='s+')print(df)

Out[1]:  name  score0    A      11    A      22    A      33    A      44    A      55    B      26    B      47    B      68    B      8

解决此问题的一种好方法是使用生成器表达式(请参见脚注)

pd.Dataframe()
来迭代的结果
groupby
,并动态构建摘要统计数据框:

In[2]:df2 = pd.Dataframe(group.describe().rename(columns={'score':name}).squeeze()   for name, group in df.groupby('name'))print(df2)

Out[2]:   count  mean       std  min  25%  50%  75%  maxA      5     3  1.581139    1  2.0    3  4.0    5B      4     5  2.581989    2  3.5    5  6.5    8

此处,

squeeze
函数压缩维度,以将单列组摘要统计信息
Dataframe
转换为
Series

脚注 :生成器表达式的形式为

my_function(a) for a initerator
,或者是否
iterator
给我们返回两个元素
tuples
,例如
groupby
my_function(a,b) fora,b in iterator



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/404525.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号