【超几何分布问题】超几何分布是概率论中的一种离散概率分布,常用于描述在不放回抽样过程中成功事件发生的次数。它与二项分布不同,二项分布假设每次试验是独立的,而超几何分布则适用于从有限总体中进行不放回抽样的情况。
一、基本概念
- 总体(Population):总共有 $ N $ 个个体。
- 成功个体数(K):在总体中有 $ K $ 个“成功”个体。
- 样本容量(n):从中抽取 $ n $ 个个体。
- 成功次数(X):在样本中恰好有 $ X $ 个成功个体。
超几何分布的概率质量函数为:
$$
P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}}
$$
其中,$ k $ 的取值范围为:
$$
\max(0, n - (N - K)) \leq k \leq \min(n, K)
$$
二、典型应用场景
超几何分布常用于以下场景:
应用场景 | 说明 |
抽奖活动 | 如从一批产品中随机抽取若干件,计算其中合格品的数量 |
检验测试 | 如从一批待检样品中抽取样本,判断其中缺陷品数量 |
调查统计 | 如调查某群体中具有特定特征的人数 |
三、计算示例
设一个总体有 $ N = 50 $ 个球,其中 $ K = 10 $ 个是红球,其余是白球。从中随机抽取 $ n = 5 $ 个球,求抽到 $ k = 2 $ 个红球的概率。
根据公式:
$$
P(X = 2) = \frac{\binom{10}{2} \binom{40}{3}}{\binom{50}{5}}
$$
计算得:
- $\binom{10}{2} = 45$
- $\binom{40}{3} = 9880$
- $\binom{50}{5} = 2118760$
所以:
$$
P(X = 2) = \frac{45 \times 9880}{2118760} \approx 0.204
$$
即抽到 2 个红球的概率约为 20.4%。
四、超几何分布与二项分布的区别
特征 | 超几何分布 | 二项分布 |
抽样方式 | 不放回 | 放回 |
总体大小 | 有限 | 无限或可视为无限 |
独立性 | 各次试验不独立 | 各次试验独立 |
概率变化 | 随着抽样改变 | 恒定不变 |
五、总结表格
项目 | 内容 |
分布名称 | 超几何分布 |
公式 | $ P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}} $ |
应用场景 | 不放回抽样、有限总体、成功/失败事件 |
适用条件 | 总体有限、抽样不放回 |
与二项分布区别 | 抽样方式、独立性、概率变化 |
示例 | 从 50 个球中抽 5 个,求 2 个红球的概率 |
通过理解超几何分布的原理和应用,可以更准确地处理实际问题中的概率计算,特别是在小样本或有限总体的情况下。