栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

pandas练习1

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

pandas练习1

1.练习

import pandas as pd
import numpy as np
# 1.读取名为HeightWeight.csv的文件:
pr=pd.read_csv(r'heightweight.csv')
# (1)查看前10行的数据
print(pr.head(10))
# (2)查看前7行的数据
print(pr.head(7))
# (3)查询特征Height(cm)=166.0的信息
print(pr[pr['Height(cm)']==166])
# (4)查询特征 Sex=0,Height(cm)=167.0的信息
print(pr[(pr['Sex']==0) & (pr['Height(cm)']==167.0)])
# (5)查询身高 170.0--175.0 之间的信息
print(pr[(pr['Height(cm)']>=170) & (pr['Height(cm)']<=175)])
print(pr[pr['Height(cm)'].between(left=170,right=175)])
# 2.读取名为测试.csv的文件,将第三行设为标题行,并将标题行的名字改为 Sex name age
pp=pd.read_csv(r'测试.csv',header=2,delimiter=':',names=['sex','name','age'])
print(pp)
# 3.读取销售情况统计表.xlsx中的第二个子表
ppp=pd.read_excel(r'销售情况统计表.xlsx',sheet_name='1903A')
print(ppp)

2.练习

import pandas as pd
import numpy as np
# 4.创建如下图所示的数据帧
data2={
    'name':['Tom','Mary','Sam'],
    'age':[22.0,np.NaN,18.0],
    'sex':['m','f','m']

}
ffpp=pd.Dataframe(data2)
print(ffpp)
# (1)查看当前数据是否为NaN
print(ffpp.isnull())
# (2)在特征age下,是否有数据为空,并输出空的行
print(ffpp['age'].isnull())

# (3)在特征age下,输出非空的行
print(ffpp[ffpp['age'].isnull()])
# (4)统计每个特征缺失值的数量
print(ffpp.isnull().sum())

# (5)将缺失值的地方数据填充为24
print(ffpp.fillna(24))
# (6)删除有缺失值的地方所在的那一行

print(ffpp.dropna(axis=0,how='any',inplace=False))
# (7)查看数据帧的所有信息
print(ffpp.info)
# (8)查看数据的描述
print(ffpp.describe())

3.练习

import pandas as pd
import numpy as np
# 5.加载 loans.xls 数据集
pa=pd.read_excel(r'..pandas代码loans.xls')
print(pa)
# (1)统计贷款号的样本数
print(pa['贷款号'].count())
print(pa.count()['贷款号'])
print(pa['贷款号'].sum())
# print(pa.groupby('贷款号').sum())
# (2)统计贷款金额的总和
print(pa['贷款金额'].sum())
# (3)统计每月归还额的平均数
print(pa['每月归还额'].mean())

4.练习`

import pandas as pd
# 1.创建如上图所示的数据帧
# 方法一
data={
    'Name':['Ella','Leo','Mark','Lily'],
    'Sex':['f','m','m','f'],
    'MScore':[99,88,92,85]
}
# 方法二
# data=[{'Name':'Ella','sex':'f','Mscore':99},
# {'Name':'Leo','sex':'m','Mscore':88},
# {'Name':'Mark','sex':'m','Mscore':92},
# {'Name':'MScore','sex':'f','Mscore':85}
# ]
dataframe=pd.Dataframe(data,['a','b','c','d'])
print(dataframe)
# 2.查看 Name 列数据
# print(dataframe.columns)
print(dataframe['Name'])
# d=dataframe.drop(labels=['Name'],axis=1)
# print(d)
# 3.查看 Leo 所在行的数据
# print(dataframe.iloc[1])
print(dataframe.loc['b'])
# 4.添加一列 Cscore ,其中数据为 95,86,91,88
p=dataframe['Cscore']=[95,86,91,88]
print(dataframe)
# 5.添加一列Sum ,其中数据等于Mscore这一列数据加上Cscore列数据
dataframe['Sum']=dataframe['MScore']+dataframe['Cscore']
print(dataframe)
# 6.对Sum这一列进行升序排序
print(dataframe.sort_values('Sum'))
# 7.统计Sum列的平均值并输出
print(dataframe['Sum'].mean())
# 8.统计Sum列的最大值并输出
print(dataframe['Sum'].max())
# 9.删除 Sex 列
del dataframe['Sex']
# dataframe.drop('Sex')
print(dataframe)
# 10.查看当前数据帧是否有缺失值
print(dataframe.isnull())
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/339677.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号