本文将从Python生态、Pandas历史背景、Pandas核心语法、Pandas学习资源四个方面去聊一聊Pandas 期望能带给大家一点启发
Python生态里的Pandas
五月份TIOBE编程语言排行榜 Python追上Java又回到第二的位置。Python如此受欢迎一方面得益于它崇尚简洁的编程哲学 另一方面是因为强大的第三方库生态。
要说杀手级的库 很难排出个先后顺序 因为python的明星库非常多 在各个领域都算得上出类拔萃。
比如web框架-Django、深度学习框架-TensorFlow、自然语言处理框架-NLTK、图像处理库-PIL、爬虫库-requests、图形界面框架-PyQt、可视化库-Matplotlib、科学计算库-Numpy、数据分析库-Pandas…
上面大部分库我都用过 用的最多也最顺手的是Pandas 可以说这是一个生态上最完整、功能上最强大、体验上最便捷的数据分析库 称为编程界的Excel也不为过。
Pandas在Python数据科学链条中起着关键作用 处理数据十分方便 且连接Python与其它核心库。
十项全能的Pandas
Pandas诞生于2008年 它的开发者是Wes McKinney 一个量化金融分析工程师。
因为疲于应付繁杂的财务数据 Wes McKinney便自学Python 并开发了Pandas。
大神就是这么任性 没有 就创造。
为什么叫作Pandas 其实这是“Python data analysis”的简写 同时也衍生自计量经济学术语“panel data” 面板数据 。
所以说Pandas的诞生是为了分析金融财务数据 当然现在它已经应用在各个领域了。
Pandas能做什么呢
它可以帮助你任意探索数据 对数据进行读取、导入、导出、连接、合并、分组、插入、拆分、透视、索引、切分、转换等 以及可视化展示、复杂统计、数据库交互、web爬取等。
同时Pandas还可以使用复杂的自定义函数处理数据 并与numpy、matplotlib、sklearn、pyspark、sklearn等众多科学计算库交互。



