栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python pandas dataframe group

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python pandas dataframe group

groupby() 用法

pandas 可以很方便的对Dataframe中的数据进行分组处理,可以按单列、多列进行分组,可以对分组的内容通过agg方法进行sum、min、max、 count等聚合运算,在应用当中,使用率非常的高,下面通过代码对这个方法的使用进行详细解说

以下代码截图来自Jupyter中文集成版(Python整合版)

Git地址:

GitHub - DaiMaBang/Jupyter: Jupyter中文集成版(Python整合版),是把python3.8和jupyter notebook高度集成,jupyter傻瓜式安装,用最简洁友好的纯中文方式(jupyter汉化100%)展现出来的优秀Jupyter绿色使用工具。本工具,把Jupyter的复杂操作简单化,集成pandas、numpy、matplotlib等常用三方库,并附带一些python的基础语法、pandas使用、股票分析实例,让您能最快的开始Jupyter的编写。https://github.com/DaiMaBang/Jupyter

默认df.groupby()后,返回的是对象内存地址,看起来不直观 ,通过list进行列表转换,可以看到,列表的大小是2,里面包含,两个元组类型的数据,每个元组由分组列的值和Dataframe组成

也可以通过for ... in 从里面读取出对应的数据 

 

看到这要的数据,在实际应用当中,没有太大的意义,一般真正实用的,就是把分组后的数据,再进行agg方法处理,进行对应的列聚合,可以对一列,或者多列进行聚合。

 这个数据 看着跟Dataframe不是太像,可读性不是太好,有没有更直观的表现哪?可以,只用把索引重置一下就可以了,df.reset_index()

之所有出现上面的数据情况,是因为,groupby后,默认把分组的列做为索引 ,当不想用重置索引,可以在分组的时候,指定,不以分组列做为索引(默认是做为索引的)

 

 

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/739216.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号