栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

4 Pandas 数据结构之生成DataFrame

4 Pandas 数据结构之生成DataFrame

目录

用 列表 生成 Dataframe

用 多维数组字典 生成 Dataframe

用 Series字典 生成 Dataframe

用 列表字典 生成 Dataframe

用 元组字典 生成 Dataframe


Dataframe 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。

Dataframe 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

Dataframe 构造方法如下:

pandas.Dataframe( data, index, columns, dtype, copy)

参数说明:

data:一组数据(ndarray、series, map, lists, dict 等类型)。

index:索引值,或者可以称为行标签。

columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。

dtype:数据类型。

copy:拷贝数据,默认为 False。

用 列表 生成 Dataframe
import pandas as pd
data = [['Google', 10], ['Runoob', 12], ['Wiki', 13]]
df = pd.Dataframe(data, columns=['Site', 'Age'], dtype=float)
print(df)

用 多维数组字典 生成 Dataframe

多维数组的长度必须相同。如果传递了索引参数,index 的长度必须与数组一致。如果没有传递索引参数,生成的结果是 range(n),n 为数组长度。

import pandas as pd
data = {'Site': ['Google', 'Runoob', 'Wiki'], 'Age': [10, 12, 13]}
df = pd.Dataframe(data)
print(df)

 

用 Series字典 生成 Dataframe
import pandas as pd

data = {'one': pd.Series([1., 2., 3.], index=['a', 'b', 'c']),
        'two': pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
df = pd.Dataframe(data)
print(df)

用 列表字典 生成 Dataframe
import pandas as pd
data = [{'a': 1, 'b': 2}, {'a': 5, 'b': 10, 'c': 20}]
df = pd.Dataframe(data)
print(df)

 

用 元组字典 生成 Dataframe

元组字典可以自动创建多层索引 Dataframe。

import pandas as pd

df = pd.Dataframe({('a', 'b'): {('A', 'B'): 1, ('A', 'C'): 2},
                   ('a', 'a'): {('A', 'C'): 3, ('A', 'B'): 4},
                   ('a', 'c'): {('A', 'B'): 5, ('A', 'C'): 6},
                   ('b', 'a'): {('A', 'C'): 7, ('A', 'B'): 8},
                   ('b', 'b'): {('A', 'D'): 9, ('A', 'B'): 10}})
print(df)

 

缺失数据:Dataframe 里的缺失值用 np.nan 表示。 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/706723.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号