栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

第5章 pandas入门

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

第5章 pandas入门

整述:
pandas是有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。pandas经常和其它工具⼀同使用,如数值计算工具NumPy和SciPy,分析库statsmodels和scikit-learn,和数据可视化库matplotlib。pandas是基于NumPy数组构建的,特别是基于数组的函数和不使用for循环的数据处理。
pandas和NumPy区别:pandas是专门为处理表格和混杂数据设计的。NumPy更适合处理统⼀的数值数组数据。
5.1 pandas的数据结构介绍
两个主要数据结构:Series和DataFrame。
Series
Series是⼀种类似于⼀维数组的对象,它由一组数据(各种
NumPy数据类型)以及一组与之相关的数据标签(即索引)组
成。仅由一组数据即可产生最简单的Series:

import pandas as pd
obj=pd.Series([4,7,-5,3])
obj
#输出
0    4
1    7
2   -5
3    3
dtype: int64

可以通过Series 的values和index属性获取其数组表示形式和索引对象。
一般,我们希望所创建的Series带有⼀个可以对各个数据点进行标记的索引:

obj=pd.Series([4,7,-5,3],index=['b','v','w','q'])

对于许多应用而言,Series最重要的⼀个功能是,它会根据运算的索引标签自动对齐数据:

Series对象本身及其索引都有⼀个name属性,该属性跟pandas其他的关键功能关系非常密切

DataFrame

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/840297.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号