3-5 Pandas的层级索引

数据分析工具pandas

5. Pandas的层级索引
- 5.1 层级索引
- 5.2 选取
- - 5.2.1 外层选取
  - 5.2.2 内层选取
- 5.3 交换

Pandas是一个强大的分析结构化数据的工具集，基于NumPy构建，提供了高级数据结构和数据操作工具，它是使Python成为强大而高效的数据分析环境的重要因素之一
（1）一个强大的分析和操作大型结构化数据集所需的工具集
（2）基础是NumPy，提供了高性能矩阵的运算
（3）提供了大量能够快速便捷地处理数据的函数和方法
（4）应用于数据挖掘，数据分析
（5）提供数据清洗功能

5. Pandas的层级索引 5.1 层级索引

#层级索引
s1 = pd.Series(np.random.randn(12),index=[['a','a','a','b','b','b','c','c','c','d','d','d'],[0,1,2,0,1,2,0,1,2,0,1,2]])
#结果为：
#a  0    0.972595
#   1   -1.665244
#   2    0.002767
#b  0   -0.711209
#   1    0.372673
#   2    2.619890
#c  0    0.007990
#   1    1.729787
#   2   -0.253180
#d  0   -0.953319
#   1   -0.305991
#   2   -1.055970
print(s1)
#结果为：
#MultiIndex(levels=[['a', 'b', 'c', 'd'], [0, 1, 2]],
#           labels=[[0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3], [0, 1, 2, 0, 1, 2, 0, 1, 2, 0, 1, 2]])
print(s1.index)
#MultiIndex为层级索引
#结果为：pandas.core.indexes.multi.MultiIndex
print(type(s1.index))

5.2 选取 5.2.1 外层选取

#1. 外层选取
#结果为：
#0   -0.711209
#1    0.372673
#2    2.619890
s1['b']

5.2.2 内层选取

#2. 内层选取
#从s1中选取所有内层索引为2的值
#结果为：
#a    0.002767
#b    2.619890
#c   -0.253180
#d   -1.055970
s1[:,2]
#选取外层索引为a 内层索引为0的值
#结果为：0.9725951575112907
s1['a',0]

5.3 交换

#1. swaplevel()交换内层和外层的索引
s1.swaplevel()
#2.sortlevel() 先对外层索引进行排序 再对内层索引进行排序 默认升序
s1.sortlevel()
#交换并排序分层
s1.swaplevel().sortlevel()

3-5 Pandas的层级索引

Python相关栏目本月热门文章