注:下面的几个例子修改自蔡驰聪《python数据分析从入门到精通》,因为自己最近在跟着这本书学习,所以一边看一边根据自己的理解修改案例
画直方图:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
#读取Excel文件数据转换为dateframe类型数据
profile_df=pd.read_excel('phone_profit.xlsx')
print(profile_df)
print(profile_df.info())
#设定x轴的总标题和标题距离坐标轴的距离
plt.xlabel('订单日期',labelpad=10)
#要解决的问题:为什么y轴的标题无法更改,还是frequency
#参数bins的值表示x轴直方图的组数,figsize表示直方图所在画图大小,传入的参数是元组类型,第一个值表示直方图宽,第二个值表示长
profile_df['利润'].plot(kind='hist',bins=30,figsize=(15,8),title='手机利润')
#设置图例所在象限位置以及字体大小
plt.legend(loc=1,fontsize=12)
plt.show()
2.画柱状图
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
saledf=pd.read_excel("phone_sale.xlsx")
saledf['year']=pd.DatetimeIndex(saledf['订单日期']).year
print(saledf)
#按年份计算每个类别的销售额
statdf=saledf.groupby(['产品类别','year']).sum()
print(statdf)
#用barh方法绘制堆叠柱状图
statdf1=statdf.unstack()
statdf1.plot(kind='barh',stacked=True,figsize=(10,7))
plt.xlim(0,25000)
#plt.legend()方法调整图例,第一个参数loc就是代表第几象限,默认是第一象限,从数字1开始表示第一象限;loc4表示图例出现在第四象限
# title表示图例的标题
plt.legend(loc=4,
#title='案例',
fontsize=10)
plt.show()



