大家好丫!我是honey我又回来了。这几天老师给我们布置了一个实验任务,就是分析一组航空数据,我也是在屁颠屁颠的搞哟!
我想跟大家分享一下我的进度(是渣渣的我又来了)用的是anconda的jupety
拿到数据先读进来,这个我还是知道的。
| 1.导入相关库并读入数据 import pandas as pd import numpy as np import matplotlib.pyplot as plt data=pd.read_excel("实验1数据.xlsx") data1=data
- 数据异常值检测1(describe方法)。
data2=data1.describe()
- 数据异常值检测2(箱型图)
df = pd.Dataframe(data2) df.plot.box(title="异常处理") plt.grid(line, alpha=0.3) plt.show() 4. 将year作为行索引 data1.set_index('year', inplace = True) print(data1) 5.1按照年份和月份做频数分布,查看其中规律。 求出每年的乘客人数 data['year_sum']=0 for i in range(len(data)): data['year_sum'][i]=data.iloc[i,:].sum() |
| 求出每个月总和 data.loc["每个月总和"]=data.sum() 6.画出乘客年走势图,月走势图,季度走势图 #12年乘客走势条形图 fig = plt.figure() plt.bar(x,y,0.4,color="green") plt.xlabel("X-axis") plt.ylabel("Y-axis") plt.title("12年来乘客得走势图") plt.show() 乘客月走势图 plt.savefig("barChart.jpg") y.plot(kind='line',marker='',color='r',title='月乘客趋势') 季度走势图 Y.loc[:,'first']= Y.loc[:,'Jan'] + Y.loc[:,'Feb']+Y.loc[:,'Mar'] Y.loc[:,'second']= Y.loc[:,'Apr'] + Y.loc[:,'May']+Y.loc[:,'Jun'] Y.loc[:,'threed']= Y.loc[:,'Jul'] + Y.loc[:,'Aug']+Y.loc[:,'Sep'] Y.loc[:,'forth']= Y.loc[:,'Oct'] + Y.loc[:,'Nov']+Y.loc[:,'Dec'] jd.plot(kind='line',marker='',color='g',title='季度客趋势') 现在就是做到这里,感觉自己用的都是些小学生的处理方式呀! |
|