使用pandas进行数据分析的时候 我们经常需要对Dataframe的行或者列进行索引。使用pandas进行索引的方法主要有三种 直接使用行或者列标签、loc函数和iloc函数。
举个简单的例子
import numpy as np
import pandas as pd
df pd.Dataframe({ Fruits :[ apple , pear , banana , watermelon ], Price :[1.2,1.4,2.3,4.2], Sales :[11,45,25,16]})
df
生成的Dataframe如下所示
FruitsPriceSales0apple1.2111pear1.4452banana2.3253watermelon4.216 1、直接使用行或者列标签假如我们要选取df的Fruits和Price两列 则
df[[ Fruits , Price ]]FruitsPrice0apple1.21pear1.42banana2.33watermelon4.2
假如我们要选取df的第2、3行 则
df[2:4]FruitsPriceSales2banana2.3253watermelon4.216 2、loc函数
loc函数是基于行标签和列标签进行索引的 其基本用法为
Dataframe.loc[行标签,列标签]
假如我们要选取df的第2、3行和Price、Sales对应的列 则
df[2:3, Price : Sales ]PriceSales22.32534.216
假如我们要选取所有的行和Fruits、Sales对应的列 则
df.loc[:,[ Fruits , Sales ]]FruitsSales0apple111pear452banana253watermelon16 3、iloc函数
iloc函数是基于行和列的位置进行索引的 索引值从0开始 并且得到的结果不包括最后一个位置的值 其基本用法为
Dataframe.iloc[行位置,列位置]
假如我们要选取df的第2、3行和第1、2列 则
df.iloc[2:4,1:3]PriceSales22.32534.216
假如我们要选取所有的行和第0、2列 则
df.iloc[:,[0,2]]FruitsSales0apple111pear452banana253watermelon16



