数据清洗常用函数——drop fillna
1
dropna 清理无效数据,默认how=any,axis=0 将含有Nan的行删除
how可选=any all
axis=0删除行 =1 删除列
thresh参数=3 说明这一行有>=3个Nan时改行才会被删
2.
drop按照条件删除行/列
删除某行/列 按照索引
删除某列
删除某行
条件删除:如果A列中含有的元素小于2或者大于80,则删除此行
**data3=df.drop(df[(df[‘A’]<2|df[‘A’]>80)].index)**
注意,这行代码测试时报错
2.fillna函数 填充空值
array.fillna(10) 数值填充
不同列不同数值填充:
用该列的前一个/后一个非NaN的值填充NaN
ffill与bfill
data3=df.fillna(method=‘bfill’)
同下一列的数一样



