这里只讨论大样本情况下的总体比例的估计问题。
当样本容量足够大时,样本比例p的抽样分布可用正态分布近似。
p的数学期望等于总体的比例
π
pi
π
某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。
from scipy import stats import numpy as np # 已知样本量 n = 100 # 计算比例p p = 65/100 # 显著性水平 a = 0.05
计算 z a / 2 z_{a/2} za/2
z_a2 = stats.norm.isf(a/2) z_a2
1.9599639845400545
left = p - z_a2 * np.sqrt(p*(1-p)/n)
right = p + z_a2 * np.sqrt(p*(1-p)/n)
print('95%置信区间为{:.2f}%,{:.2f}%'.format(left*100,right*100))
95%置信区间为55.65%,74.35%



