- 偏度和峰度
- 偏度
- 峰度
- 实例
- 随机数据
- 符合正态分布的数据
衡量对称性
偏度>0,说明随机变量x右边偏离均值比较多,这样的数据分布称为右偏或者正偏。
偏度>0,说明随机变量x左边偏离均值比较多,这样的数据分布称为左偏或者负偏。
峰度衡量偏度
峰度比较大,说明随机变量x偏离均值的极端值比较多
峰度比较小,说明随机变量x偏离均值的极端值比较少
实例numpy和pandas负责把数据准备好 matplotlib负责把数据制作成图随机数据
import numpy as np
import pandas
import seaborn as sns
from scipy.stats import norm
from matplotlib import pyplot as plt
data = list(np.random.randn(10000)) # 满足高斯分布的10000个数
print('最大值:', max(data))
print('最小值:', min(data))
print("均值:", np.mean(data))
print('中位数:', np.median(data))
print('四分位数:', np.percentile(data, [25, 50, 75]))
print('(总体)方差:', np.var(data))
print('标准差:', np.std(data))
# 偏度和峰度
s = pandas.Series(data)
bias_value = s.skew()
peak_value = s.kurt()
print("偏度:", bias_value)
print("峰度:", peak_value)
# 绘图
sns.distplot(data, fit=norm)
(mu, sigma) = norm.fit(data)
plt.legend(['Normal dist. ($mu=$ {:.2f} and $sigma=$ {:.2f} )'.format(mu, sigma)], loc='best')
plt.ylabel('Frequency')
plt.title('Distribution')
plt.show()



