- 5. Pandas的层级索引
- 5.1 层级索引
- 5.2 选取
- 5.2.1 外层选取
- 5.2.2 内层选取
- 5.3 交换
Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了 高级数据结构和 数据操作工具,它是使Python成为强大而高效的数据分析环境的重要因素之一
(1) 一个强大的分析和操作大型结构化数据集所需的工具集
(2) 基础是NumPy,提供了高性能矩阵的运算
(3) 提供了大量能够快速便捷地处理数据的函数和方法
(4)应用于数据挖掘,数据分析
(5)提供数据清洗功能 5. Pandas的层级索引 5.1 层级索引
#层级索引 s1 = pd.Series(np.random.randn(12),index=[['a','a','a','b','b','b','c','c','c','d','d','d'],[0,1,2,0,1,2,0,1,2,0,1,2]]) #结果为: #a 0 0.972595 # 1 -1.665244 # 2 0.002767 #b 0 -0.711209 # 1 0.372673 # 2 2.619890 #c 0 0.007990 # 1 1.729787 # 2 -0.253180 #d 0 -0.953319 # 1 -0.305991 # 2 -1.055970 print(s1) #结果为: #MultiIndex(levels=[['a', 'b', 'c', 'd'], [0, 1, 2]], # labels=[[0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3], [0, 1, 2, 0, 1, 2, 0, 1, 2, 0, 1, 2]]) print(s1.index) #MultiIndex为层级索引 #结果为:pandas.core.indexes.multi.MultiIndex print(type(s1.index))5.2 选取 5.2.1 外层选取
#1. 外层选取 #结果为: #0 -0.711209 #1 0.372673 #2 2.619890 s1['b']5.2.2 内层选取
#2. 内层选取 #从s1中选取所有内层索引为2的值 #结果为: #a 0.002767 #b 2.619890 #c -0.253180 #d -1.055970 s1[:,2] #选取外层索引为a 内层索引为0的值 #结果为:0.9725951575112907 s1['a',0]5.3 交换
#1. swaplevel()交换内层和外层的索引 s1.swaplevel() #2.sortlevel() 先对外层索引进行排序 再对内层索引进行排序 默认升序 s1.sortlevel() #交换并排序分层 s1.swaplevel().sortlevel()



