- 单个
df[['age','grade']].median() #计算age grade每一列的中位数 当然前提是他们要为数值型数据
- 总体
df[['age','grade']].describe() #计算min,max,std,median...当然只会显示类型是数字列的信息
- 自定义(如果你嫌弃descrbe()给出的值太多)
df[['age','grade']].agg({
'age':['min','max']
'grade':['min','s']
}) #计算age列的min max grade列的min std
分组
- 分组
df.groupby(['sex','profession']) - 获取分组
df.groupby(['Sex','Pclass']).get_group(('male',1))
分组后每个组就是一个单独的Series,你可以对于该组使用使用与Series的方法,如计算最小最大值等等。
数值统计- 查看每一列的回答种类有哪些
df['lable'].unique #为一个属性,不是函数 所以没有()
- 查看每一种回答种类的个数统计
df['sex'].value_counts() #统计sex下回答有几种,并统计他们各自的个数
[TIPS] :相当于df.groupby('sex')['sex'].count()



