栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

pandas快速入门指南

pandas快速入门指南

Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来,享有数据分析“三剑客之一”的盛名(NumPy、Matplotlib、Pandas)。是学习数据分析、AI机器学习必学组件之一。
Pandas 这个名字来源于面板数据(Panel Data)与数据分析(data analysis)这两个名词的组合。在经济学中,Panel Data 是一个关于多维数据集的术语。Pandas 对数据的处理是为数据的分析服务的,它所提供的各种数据处理方法、工具是基于数理统计学出发,包含了日常应用中的众多数据分析方法。

Pandas 可以实现复杂的处理逻辑,这些往往是 Excel 等工具无法处理的,还可以自动化、批量化,对于相同的大量的数据处理我们不需要重复去工作。Pandas 的出现使得 Python 做数据分析的能力得到了大幅度提升,它主要实现了数据分析的五个重要环节:

加载数据整理数据操作数据构建数据模型分析数据

主要特点

它提供了一个简单、高效、带有默认标签(也可以自定义标签)的 Dataframe 对象。能够快速得从不同格式的文件中加载数据(比如
Excel、CSV 、SQL文件),然后将其转换为可处理的对象;能够按数据的行、列标签进行分组,并对分组后的对象执行聚合和转换操作;能够很方便地实现数据归一化操作和缺失值处理;能够很方便地对 Dataframe 的数据列进行增加、修改或者删除的操作;能够处理不同格式的数据集,比如矩阵数据、异构数据表、时间序列等;提供了多种处理数据集的方式,比如构建子集、切片、过滤、分组以及重新排序等。

本教程梳理了快速入门pandas的一些知识点。

一、pandas数据结构(Series和Dataframe)

二、pandas数据加载(csv、excel、json、mysql、webAPI)

三、pandas基本操作之数据访问(查看与检索)

四、pandas数据分析之排序和排名(sort和rank)

五、pandas数据清洗之处理缺失、重复、异常数据

六、pandas数据处理之数据转换(映射map、替换replace、重命名rename)

七、pandas数据分析之数据运算(逻辑运算、算术运算、统计运算、自定义运算)

八、pandas数据处理之合并与拼接

九、pandas数据分析之分组聚合

十、pandas数据分析之数据重塑透视(stack、unstack、melt、pivot)

十一、pandas数据分析之数据绘图

学习pandas最好的资料肯定是pandas的官网 https://pandas.pydata.org/docs/user_guide/index.html

书籍推荐pandas的作者写的《利用python进行数据分析》


本教程作者博客:http://xiejava.ishareread.com/

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/745749.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号