栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

熊猫数据框中选定列和计数中值的唯一组合

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

熊猫数据框中选定列和计数中值的唯一组合

你可以

groupby
上的cols“A”和“B”和呼叫
size
,然后
reset_index
rename
生成列:

In [26]:df1.groupby(['A','B']).size().reset_index().rename(columns={0:'count'})Out[26]:     A    B  count0   no   no      11   no  yes      22  yes   no      43  yes  yes      3

更新

简要说明一下,通过将2列分组,将A和B值相同的行分组,我们称之为

size
返回唯一组数:

In[202]:df1.groupby(['A','B']).size()Out[202]: A    B  no   no     1     yes    2yes  no     4     yes    3dtype: int64

现在,要还原分组的列,我们调用

reset_index

In[203]:df1.groupby(['A','B']).size().reset_index()Out[203]:      A    B  00   no   no  11   no  yes  22  yes   no  43  yes  yes  3

这将还原索引,但是大小聚合将变成生成的column

0
,因此我们必须重命名此名称:

In[204]:df1.groupby(['A','B']).size().reset_index().rename(columns={0:'count'})Out[204]:      A    B  count0   no   no      11   no  yes      22  yes   no      43  yes  yes      3

groupby
确实接受了
as_index
我们可以设置为的arg
False
因此它不会使分组的列成为索引,但是这会生成a,
series
并且您仍然必须还原索引,依此类推....:

In[205]:df1.groupby(['A','B'], as_index=False).size()Out[205]: A    B  no   no     1     yes    2yes  no     4     yes    3dtype: int64


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/455693.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号