关注微信公众号:数据研发技术,点击菜单:PY宝典,查看往期精彩内容
数据分析时,有时会要对数据做一些变形才能更好地分析,Pandas提供了灵活的方法应对该场景,包括stack和pivot table。
- stack:将dataframe中的列转为行。
- pivot table:数据透视表,功能比较丰富,大多数场景都可适用。
下面使用图中两套数据对这两个功能进行说明
Stack提供了行转列与列转行的操作,使用.stack将列转为行,还可以使用.unstack将行转为列(stack的逆操作),返回的是Series或Dataframe。
1.1 Stack将dataframe中指定level的列转为行,在上图数据列是单层,其列的level值既是0(类似于列表下标从0开始)也是-1(同列表下标倒数)。
- level的默认值为-1,即将最内层的列转为行
- 若dataframe中的列是单层,返回的是一个Series
- 若dataframe有多层列,返回的是一个将指定level列转为行的dataframe
对示例数据做列转行操作
-
将最内层列(level=-1)转为行
# 以下写法效果一致 df8.stack() df8.stack(-1) df8.stack(1)
-
将weight转为行,(level=0或level=-2)
df8.stack(0) df8.stack(-2)
-
将所有列都转为行,此时返回Series,同时可以看到其有多重索引
s1=df8.stack([0,1])
unstack是stack的逆操作,将Dataframe或Series中指定level的index转为列。
- level值默认为-1,即将最内层的index转为列
- 如果index只有一层,返回的值将是一个Series
- 若index有多层,而未全部转为列,返回的值是一个Dataframe
对上文中的结果s1执行.unstack操作
-
将最内层index转为列
# 以下语句执行效果一致 s1.unstack() s1.unstack(-1) s1.unstack(2)
-
将中间层index转为列
s1.unstack(1) s1.unstack(-2)
-
将多个index转为列
s1.unstack([1,2])
点个关注再走呗



