栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Pandas库入门

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Pandas库入门

一、Pandas库介绍

        1.什么是Pandas?  

                是提供高性能、易用数据类型和分析工具的第三方库。

                        简单说Pandas提供了两个事情

                        (1) 提供了便于操作数据的数据类型

                        (2)提供了很多的分析函数与分析工具

        2.引用
import pandas as pd

                 Pandas是基于Numpy实现的,与Numpy和Matplotlib一同使用。

        3.Pandas库的理解

                        Pandas库主要提供了两个数据类型:Series      Dataframe

                Series:相当于一个一维数据类型

                Dataframe:相当于一个二维到多维的数据类型

                         围绕这两个数据类型Pandas提供了基于上述数据类型的各类操作:基本操作、运算操作、特征类操作、关联类操作

                对比Numpy与Pandas

 二、Pandas库中的Series类型

        series类型:由一组数据及与之相关的数据索引组成

               

#自动索引
import pandas as pd
a = pd.Series([9,8,7,6])
print(a)

#自定义索引
import pandas as pd
a = pd.Series([9,8,7,6],['a','b','c','d'])
print(a)
print(a['b'])

Series类型可以由如下类型创建:

        1.从标量值创建
import pandas as pd
s = pd.Series(25,index=['a','b','c']) #这时候为了创建  必须怎加一个index这个区域,为了告诉Series,尽管你给了一个值是25,但是要生成的数组类型是个什么样的结构,
                                    # 就是说它是由几个元素构成的,他的标签是多少,这个时候我们必须要给出第二个参数。这就是从标量创建Series
print(s)
        2.从字典创建
import pandas as pd
d = pd.Series({'a':9,'b':8,'c':7})
print(d)

用index来改变形状

         3.从ndarray创建
import pandas as pd
import  numpy as np
n = pd.Series (np.arange(5))  #arange函数生成一个由五个元素生产的ndarry类型,他被转换成Series类型
print(n)

#可以用np.arange给出值,并且同时给出index(即索引)
m = pd.Series(np.arange(5),index=np.arange(9,4,-1))
print(m)

        4.总结

Series类型可以由如下类型创建:

  • Python列表,index与列表元素个数一致
  • 标量值,index表达Series类型的尺寸
  • Python字典,键值对中的“键”是索引,index从字典中进行选择操作
  • ndarray,索引和数据都可以通过ndarray类型创建
  • 其他函数,range()函数等

5.series类型的基本操作

Series类型包括index和values两部分

Series类型的操作类似ndarray类型

Series类型的操作类似Python字典类型

 

Series类型的操作类似ndarray类型:
  • 索引方法相同,采用[]
  • NumPy中运算和操作可用于Series类型
  • 可以通过自定义索引的列表进行切片
  • 可以通过自动索引进行切片,如果存在自定义索引,则一同被切片

Series类型的操作类似Python字典类型:
  • 通过自定义索引访问
  • 保留字in操作
  • 使用.get()方法

 

 

  三、Pandas库中的Dataframe类型

                 Dataframe类型由共用相同索引的一组列组成

                横向的表明不同列的叫做column,纵向的叫做index。

             总结                            

                        Dataframe是一个表格型的数据类型,每列值类型可以不同

                        Dataframe既有行索引、也有列索引

                        Dataframe常用于表达二维数据,但可以表达多维数据

        DataFram类型可以由如下类型创建:                  1.从而为ndarry对象创建

表示生成一个10元素的ndarry类型,然后将它重新变为2*5维度

                2.从一维ndarray对象字典创建

                3.从列表类型的字典创建 

 

import pandas as pd
d1 = {"城市":['北京','上海','广州','深圳','沈阳'],
      "环比":[101.5,101.2,101.3,102.0,100.1],
      "同比":[120.7,107.3,119.4,140.9,101.4],
      "定基":[121.4,127.8,120.0,145.5,101.6]}

d=pd.Dataframe(d1,index=['C1','C2','C3','C4','C5'])
print(d)

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/348104.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号