超几何分布:离散分布中的抽样问题,深入理解超几何分布的应用
发布时间: 2024-07-04 04:34:19 阅读量: 108 订阅数: 54
关于超几何分布高阶矩的研究 (2014年)
![超几何分布:离散分布中的抽样问题,深入理解超几何分布的应用](https://img-blog.csdnimg.cn/cd8c988eade94e2f988876b63bd88bea.png)
# 1. 超几何分布简介
超几何分布是一种离散概率分布,用于描述从有限总体中无放回抽取指定数量样本时,目标事件发生的次数。它广泛应用于抽样调查、质量控制和遗传学等领域。超几何分布的概率质量函数由以下公式给出:
```
P(X = x) = (C(M, x) * C(N - M, n - x)) / C(N, n)
```
其中:
* N:总体的样本容量
* M:目标事件在总体中出现的次数
* n:抽取的样本容量
* x:目标事件在样本中出现的次数
# 2. 超几何分布的理论基础
### 2.1 超几何分布的定义和性质
**定义:**
超几何分布是一种离散概率分布,用于描述从有限总体中无放回抽取一定数量样本时,成功事件发生的次数。成功事件是指样本中包含特定元素的次数。
**性质:**
* **离散性:** 超几何分布的概率质量函数只在离散的整数点上取非零值。
* **有限总体:** 总体必须是有限的,并且每个元素在总体中只能出现一次。
* **无放回抽样:** 抽取样本时不将已抽取的元素放回总体中。
* **成功事件:** 成功事件是指样本中包含特定元素的次数。
### 2.2 超几何分布的概率质量函数
超几何分布的概率质量函数为:
```
P(X = x) = (C(M, x) * C(N - M, n - x)) / C(N, n)
```
其中:
* `N` 是总体的容量
* `M` 是成功事件在总体中出现的次数
* `n` 是抽取的样本容量
* `x` 是样本中成功事件发生的次数
**参数说明:**
* `C(n, k)` 表示从 `n` 个元素中选取 `k` 个元素的组合数,计算公式为 `C(n, k) = n! / (k! * (n - k)!)`。
**代码块:**
```python
import scipy.special
def hypergeometric_pmf(x, N, M, n):
"""计算超几何分布的概率质量函数。
Args:
x: 成功事件发生的次数。
N: 总体的容量。
M: 成功事件在总体中出现的次数。
n: 抽取的样本容量。
Returns:
超几何分布的概率质量函数值。
"""
return (scipy.special.comb(M, x) * scipy.special.comb(N - M, n - x)) / scipy.special.comb(N, n)
```
**逻辑分析:**
该代码块使用 `scipy.special` 模块中的 `comb` 函数计算组合数,然后根据超几何分布的概率质量函数公式计算概率值。
### 2.3 超几何分布的期望值和方差
**期望值:**
超几何分布的期望值为:
```
E(X) = n * M / N
```
**方差:**
超几何分布的方差为:
```
Var(X) = n * M * (N - M) * (N - n) / (N^2 * (N - 1))
```
**代码块:**
```python
def hypergeometric_mean(N, M, n):
"""计算超几何分布的期望值。
Args:
N: 总体的容量。
M: 成功事件在总体中出现的次数。
n: 抽取的样本容量。
Returns:
超几何分布的期望值。
"""
return n * M / N
def hypergeometric_variance(N, M, n):
"""计算超几何分布的方差。
Args:
```
0
0