栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

【Pandas 基础知识 GroupBy分组】

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

【Pandas 基础知识 GroupBy分组】

前言

      本文通过图解Pandas   groupby分组机制,介绍了Pandas对Series,DataFrame分组的基础知识和groupby对象的两个重要属性;总结了分组的万能公式和注意事项,适合初学者学习参考。

目录

一、 图解GroupBy机制

groupby对象的重要属性

二、Series分组操作

1.单键分组 

2.多键分组

3.生成唯一键对索引的多层索引

三 DataFrame分组操作

1.单键分组

 2.多键分组

四 遍历DataFrame

1.DataFrame的可迭代属性

总结


一、 图解GroupBy机制

 

 

groupby()函数使Series或DataFrame生成了一个groupby对象,这个对象没有进行任何计算,只是保存了这个对象所拥有的基本信息。

groupby对象的重要属性

1 groupby对象可以进行sum(),mean()等计算;

2 groupby对象支持迭代,会生成一个包含数组名和数据块的2维元组序列;

二、Series分组操作

记忆公式:Series.groupby('key').sum()/mean()

1.单键分组 
import pandas as pd
import numpy as np

df=pd.DataFrame({'key1':['曹操','曹操','刘备','刘备','孙权'],
                'key2':['夏侯','许褚','赵云','马超','周瑜'],
                'data1':np.random.randn(5),
                'data2':np.random.randn(5)})
df['data1'].groupby(df['key1']) #生成groupby对象
df['data1'].groupby(df['key1']).sum() #对分组进行求和运算

2.多键分组
df['data1'].groupby([df['key1'],df['key2']]).sum()

 

3.生成唯一键对索引的多层索引
df['data1'].groupby([df['key1'],df['key2']]).sum().unstack()

三 DataFrame分组操作

 记忆公式:DataFrame.groupby('key').sum()/mean()

1.单键分组
df.groupby(df['key1']).sum()

 2.多键分组
df.groupby([df['key1'],df['key2']]).sum()

 

四 遍历DataFrame

1.DataFrame的可迭代属性

GroupBy对象支持迭代,生成一个包含数组名和数组块的2维元组序列;

for name,group in df.groupby(['key1','key2']):
    print(name)
    print(group)


总结

Series,DataFrame对象分组万能公式:

Series/DataFrame.groupby('key'/['key1','key2'...]).sum()/mean()

groupby后面传入的key生成新Series,DataFrame的index;

groupby后面传递的如果是列表或数组,此操作返回的对象是分组的DataFrame;
groupby后面传递的如果是单个列名,此操作返回的对象是Series;

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/870817.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号