栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

利用python进行数据分析——pandas相关系数、缺失值处理

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

利用python进行数据分析——pandas相关系数、缺失值处理

  • 相关系数和协方差
  1. Series的corr方法用于计算两个Series中重叠的非NA的按索引对齐的值的相关系数,cov用于计算协方差
  2. Dataframe的corr和cov将计算Dataframe的相关系数矩阵&协方差矩阵
  3. Dataframe的corrwith方法可以计算其列或行跟另一个Series和Dataframe之间的相关系数
  • 唯一值、值计数以及成员资格
  1. unique:计算Series中的唯一值,按发现的顺序返回
  2. value_counts:返回一个Series,其索引值为唯一值,其值为频率,按计数值降序排列
  3. isin:返回Series各值是否包含于传入的值序列中的布尔型数组
  • 处理缺失数据

        缺失数据在大部分数据分析应用中都很常见。pandas的设计目标之一就是让缺失数据的处理任务尽量轻松(pandas对象上的所有描述统计都排除了缺失数据)

        pandas使用浮点值NaN表示浮点和非浮点数组中的缺失数据。

        python内置的None值也会被当做NA值处理。 

        过滤缺失数据   dropna(Series.dropna()、Dataframe.dropna())

        填充缺失数据   fillna

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/323940.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号