【超几何分布的数学期望和方差的算法】超几何分布是概率论中一种重要的离散概率分布,常用于描述在不放回抽样中成功次数的概率分布。与二项分布不同,超几何分布适用于有限总体且抽样不放回的情况。本文将总结超几何分布的数学期望和方差的计算方法,并以表格形式展示关键公式。
一、超几何分布的基本概念
设一个总体中有 $ N $ 个元素,其中 $ K $ 个是“成功”元素,其余 $ N - K $ 个为“失败”元素。从总体中随机抽取 $ n $ 个样本(不放回),设 $ X $ 表示这 $ n $ 个样本中“成功”的数量,则 $ X $ 服从参数为 $ (N, K, n) $ 的超几何分布,记作:
$$
X \sim \text{Hypergeometric}(N, K, n)
$$
二、数学期望与方差的计算公式
1. 数学期望(均值)
超几何分布的数学期望表示在 $ n $ 次不放回抽样中,平均能抽到的成功次数。其计算公式为:
$$
E(X) = n \cdot \frac{K}{N}
$$
该公式表明,期望值与二项分布类似,只是在有限总体中进行调整。
2. 方差
超几何分布的方差考虑了不放回抽样的影响,因此其方差比二项分布小。其计算公式为:
$$
\text{Var}(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1}
$$
其中,$\frac{N - n}{N - 1}$ 是有限总体校正因子,用来调整不放回抽样对方差的影响。
三、公式总结表
项目 | 公式 | 说明 |
数学期望 | $ E(X) = n \cdot \frac{K}{N} $ | 抽取 $ n $ 次中期望的成功次数 |
方差 | $ \text{Var}(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ | 不放回抽样下的方差,包含有限总体修正因子 |
四、实例说明
假设有一个盒子中有 50 个球,其中 10 个是红色球(成功),40 个是蓝色球(失败)。从中不放回地抽取 5 个球,求红球数的期望和方差。
- $ N = 50 $, $ K = 10 $, $ n = 5 $
期望:
$$
E(X) = 5 \cdot \frac{10}{50} = 1
$$
方差:
$$
\text{Var}(X) = 5 \cdot \frac{10}{50} \cdot \left(1 - \frac{10}{50}\right) \cdot \frac{50 - 5}{50 - 1} = 5 \cdot 0.2 \cdot 0.8 \cdot \frac{45}{49} \approx 0.7347
$$
五、总结
超几何分布的数学期望和方差是统计分析中常用的工具,尤其适用于有限总体的不放回抽样场景。通过上述公式可以快速计算出期望和方差,从而更好地理解数据的集中趋势和离散程度。在实际应用中,需要注意总体大小对结果的影响,特别是在小样本或高比例抽样时,有限总体校正因子的作用尤为显著。