一、瞎讲
- pandas读取文件read_csv无法编译含中文的路径jupyter编译不能含空格?pandas内置函数区分大小写
二、知识吸收
1.读取
逐块 chunk:类型——TextFileRaeder;设置——read_csv("path",chunksize= )
2.修改
修改索引:df.set_index('乘客ID',inplace=True),inplace=True表示在df上直接修改,丢弃原来索引。更改列名 2种:重命名df的列名df.columns=[ ] ;读取时赋names参数df=pd.read_csv('train.csv',names=[ ])
3.删除/隐藏列
3.1 axis参数含义:axis=1代表列,axis=0代表行
指定删除相关的列,没有带columns,所以要指出是哪个轴上的:df.drop(['B', 'C'], axis=1)
这里带有columns,所以不用加上axis参数:df.drop(columns=['B', 'C'])
3.2 drop函数的inplace参数
inplace=True 在原Dataframe修改默认False 仅修改副本
4.条件筛选
单个条件筛选:df[df['Age']<10].head()
多个条件筛选(有括号):df[(df['Age']>10)&(df['Age']<50)].head()
5.行/列的升序/降序
5.1索引的
frame.sort_index(axis=1, ascending=False)
axis默认0代表行,1为列,ascending默认True即升序,False降序
5.2 值的(只能是列的)
text.sort_values(by=['票价', '年龄'], ascending=False)



