- 一、导入包
- 二、创建 Dataframe
- 2.1 创建简单的Dataframe
- 2.2 创建值为字符串的Dataframe
- 2.3 Dataframe加入行索引
- 2.4 Dataframe加入列索引
- 三、创建 Series
- 3.1 简单创建 Series
- 3.2 创建带行名的 Series
一、导入包
import pandas as pd二、创建 Dataframe
Dataframe是一种表格型结构,含有一组有序的列,每一列可以是不同的数据类型。既有行索引,又有列索引。
代码:
pd.Dataframe({'Yes': [50, 21], 'No': [131, 2]})
输出结果:
代码:
pd.Dataframe({'Bob': ['I liked it.', 'It was awful.'], 'Sue': ['Pretty good.', 'Bland.']})
输出结果:
字典列表构造函数给列标签赋值,但只对行标签使用从0(0,1,2,3,…)升序计数。有时这是可以的,但通常我们想自己分配这些标签。
Dataframe中使用的 index 为索引,可以在构造函数中使用索引形参给它赋值。
代码:
pd.Dataframe({'Bob': ['I liked it.', 'It was awful.'],
'Sue': ['Pretty good.', 'Bland.']},
index=['Product A', 'Product B'])
输出结果:
由二维列表构造Dataframeshi时,通过 columns 和 index 分别加入列和行索引。
代码:
pd.Dataframe([['I liked it.', 'It was awful.'],
['Pretty good.', 'Bland.']],
index=['Product A', 'Product B'],
columns=['Bob', 'Sue'])
输出结果:
Series是一种类似于以为NumPy数组的对象,它由一组数据(各种NumPy数据类型)和与之相关的一组数据标签(即索引)组成的。可以用index和values分别规定索引和值。如果不规定索引,会自动创建 0 到 N-1 索引。
只需要一个列表就可以创建一个Series。
代码:
pd.Series([1, 2, 3, 4, 5])
输出结果:
3.2 创建带行名的 Series一个Series本质上是一个Dataframe的一列。因此,可以像以前一样使用索引参数为Series分配列值。但是,Series没有列名,它只有一个整体名称.
代码:
pd.Series([30, 35, 40], index=['2015 Sales', '2016 Sales', '2017 Sales'], name='Product A')
输出结果:



