栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Pandas之数据清洗篇

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Pandas之数据清洗篇

# 导入第三方模块
import pandas as pd
# 读入数据
Titanic = pd.read_csv(r'test.csv')
Titanic.head()

# 删除无意义的变量,并检查剩余自字是否含有缺失值
Titanic.drop(['a','b','c','d'], axis = 1, inplace = True)
Titanic.isnull().sum(axis = 0)

#筛选符合条件的值

value = Titanic[(Titanic.a =='male')&(Titanic.b.isnull())] 写判断条件
print(pd.Dataframe(value))

#按条件删除空值行,inplace表示是否修改原始值
Titanic.dropna(subset=['A'], inplace = True)
print(Titanic)

# 填充各组中的缺失数据
a=value.fillna(value = {'A': Titanic.A[Titanic.b == 'male'].mean()}, inplace = True)

#合并数据

df=[value,Titanic]
result=pd.concat(df)

# 将数值型的转换为类别型,否则无法对其哑变量处理
Titanic.P = Titanic.P.astype('category')
# 哑变量处理
dummy = pd.get_dummies(Titanic[['S','E','P']])

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/313964.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号