栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python数据清洗4.Pandas常用数据结构DataFrame和方法

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python数据清洗4.Pandas常用数据结构DataFrame和方法

·通过pandas.Dataframe来创建Dataframe数据结构
·pandas.Dataframe(data,index,dtype,columns)
·上述参数中,data可以为列表,array或者dict
·上述参数中,index表示行索引,columns代表列名或者列标签

用列表创建dataframe

import numpy as np
import pandas as pd

list1 = [['张三',23,'男'],['李四','27','女'],['王二','26','女']]
df1 = pd.Dataframe(list1,columns=['姓名','年龄','性别'])
print(df1)
print(df1.head(5))


head函数用于返回前五行数值

Dataframe.head(n=5)
			Return the first n rows.

Parameters:	    n : int, default 5
						    	Number of rows to select.

Returns:	           obj_head : type of caller
						      The first n rows of the caller object.

head的底层方法可以看到,head( )函数的原型中,默认的参数size大小是 5,所以会返回 5 个数据

用字典创建dataframe

df2 = pd.Dataframe({'姓名':['张三','李四','王二'],'年龄':[23,27,29],'性别':['男','女','女']})
print(df2)

用数组创建dataframe

array1 = np.array([['张三',23,'男'],['李四',27,'女'],['王二',29,'女']])
df3 = pd.Dataframe(array1,columns=['姓名','年龄','性别'],index=['a','b','c'])
print(df3)
print(df3.values)
print(df3.index) # 行索引标签
print(df3.columns.tolist())
print(df3.ndim)
print(df3.shape)
print(df3.size)
print(df3.dtypes)


series和dataframe常用方法如下

方法名称说明
values返回对象所有元素的值
index返回行索引
dtypes返回索引
shape返回对象数据形状
size返回对象的个数
ndim返回对象的维度
columns返回列标签(只针对dataframe数据结构)
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/445564.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号