栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

pandas的两大数据结构之——Series

pandas的两大数据结构之——Series

pandas库的Scries对象用来表示一维数据结构,由两个相互关联的数组组成。主数组用来存放数据,主数组的每个元素都有一个与之相关联的标签,这些标签存储在另外一个叫作Index的数组中。

1、声明Series对象

调用Series()构造函数,把要存放在Series对象中的数据以数组形式传入。

Series的输出:左侧Index是一列标签,右侧是标签对应的元素。
声明Series时,若不指定标签,pandas默认使用从0开始依次递增的数值作为标签。
然而,最好使用有意义的标签,用以区分和识别每个元素,因此,调用构造函数时,可以指定index选项,把存放有标签的数组赋给它,其中标签为字符串类型。

如果想分别查看组成Series对象的两个数组,可像下面这样调用它的两个属性:index(索引)和values(元素)。

 2、选择内部元素

指定键或者指定位于索引位置处的标签。
   

选择多个元素的方法与NumPy相同

 

或者,使用元素对应的标签(放到数组中)

 3、为元素赋值

用索引或标签选取元素后进行赋值

 4、用NumPy数组或其他Series对象定义新Series对象

 

新Series对象中的元素不是原NumPy数组或Series对象元素的副本,而是对它们的引用。如改变原有对象元素的值,新Series对象中这些元素也会发生改变。

5、筛选元素

如要获取Series对象中所有大于8的元素,可使用以下代码:

 6、Series对象运算和数学函数

适用于NumPy数组的运算符(+、-、*、/)或其他数学函数,也适用于Series对象

 至于NumPy库的数学函数,必须指定它们的出处np,并把Series实例作为参数传入

7、Series对象的组成元素

Series对象往往包含重复的元素,你很可能想知道里面都包含哪些元素,统计元素重复出现的次数或判断一个元素是否在Series中。
首先,声明一个包含多个重复元素的Series对象。

 unique()函数:帮助弄清楚Series对象包含多少个不同的元素,其返回Series去重后的元素,顺序比较随意。

value_counts()函数:不仅返回各个不同的元素,还计算每个元素在Series中的出现次数。

isin()函数:判断给定的一列元素是否包含在数据结构之中,其返回结果是布尔值,可用于筛选Series或Dataframe列中的数据。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/779553.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号