栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

pandas数据清洗

pandas数据清洗

pandas数据清洗
    • 1、使用pandas进行数据清洗
      • 1.1、数据问题
      • 1.2、读取数据
      • 1.3、切分列
      • 1.4、删除列
      • 1.5、使用布尔索引筛选
      • 1.6、应用函数
      • 1.7、删除空行
      • 1.8、去重

1、使用pandas进行数据清洗 1.1、数据问题
  1. 没有列头
  2. 一个列有多个参数
  3. 列数据的单位不统一
  4. 缺失值
  5. 重复数据
  6. 非ASCII 字符
  7. 有些列头应该是数据,而不应该是列名参数
1.2、读取数据

使用pandas读取数据时,如果原数据没有列名,需要指定列名,否则pandas将会默认使用第一行数据当做列名

1.3、切分列

函数用法:split(sep,n,expand=false)

sep表示用于分割的字符;n表格分割成多少列;expand表示是否展开为Dataframe,True输出Series,False输出Dataframe。

像name列含有firstname和lastname 需要将其拆分成两列

1.4、删除列

1.5、使用布尔索引筛选

1.6、应用函数

1.7、删除空行

1.8、去重

处理前


去重后

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/672383.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号