1、取行:行用索引取,是int型,从0开始。列用列名取,是str型。
import pandas as pd
data = pd.read_csv("1.csv").loc[4:8] #取第4行到第8列。包前又包后。
data1 = pd.read_csv("1.csv").loc[4]
>>>
9 2
4 14 7
5 15 8
6 16 9
7 17 10
8 18 11 #左边一列,4-8代表的是行号。9和2代表的是后两列的表头,即后两列的列名是9和2
>>>
Unnamed: 0 4
1 6
9 14
8 13
2 7 #只取一行时,是左边的呈现,第一列是csv文件的列名,第二列是第4行的内容。
2、取列:
import pandas as pd
data = pd.read_csv("1.csv")["9"] #取列名是“9”的那一列
data1 = pd.read_csv("1.csv")[["9","2"]] #索引以列表的形式出现
>>>
0 10
1 11
2 12
3 13
4 14
5 15 #左边一列是行号,右边一列是列名是“9”的那一列的内容
>>>
9 2
0 10 3
1 11 4
2 12 5
3 13 6
4 14 7
5 15 8
import pandas as pd
data = pd.read_csv("1.csv",usecols = ["9"])
data1 = pd.read_csv("1.csv",usecols = ["9","2"])
>>>
9
0 10
1 11
2 12
3 13
4 14
5 15
>>>
9 2
0 10 3
1 11 4
2 12 5
3 13 6
4 14 7
5 15 8
取列不论用哪种方式,取出来的数据内容都是一样的。
3、增加列
import pandas as pd
data = pd.read_csv("1.csv")
data["10"] = list([4,4,4,4,4,4,4])
>>>
1 9 8 2 10
0 2 10 9 3 4
1 3 11 10 4 4
2 4 12 11 5 4
3 5 13 12 6 4
4 6 14 13 7 4
5 7 15 14 8 4
4、对某一列除以该列最大值,得到一个0-1之间的数值
import pandas as pd
data = pd.read_csv("1.csv")
res = data["9"]/data["9"].max()
>>>
0 0.344828
1 0.379310
2 0.413793
3 0.448276
4 0.482759
5 0.517241
6 0.551724
7 0.586207
8 0.620690
9 0.655172
10 0.689655
11 0.724138
12 0.758621
13 0.793103
14 0.827586
15 0.862069
16 0.896552
17 0.931034
18 0.965517
19 1.000000



