利用二项分布验证中心极限定理
时间: 2023-08-21 22:01:39 浏览: 220
统计学三大分布与检验1
首先,二项分布是一种离散概率分布,描述在n次独立重复的伯努利试验中,成功的次数的概率分布。如果每次试验成功的概率为p,则在n次试验中成功的次数X服从二项分布B(n,p)。
中心极限定理是指在一定条件下,独立随机变量之和的分布趋近于正态分布。具体来说,如果有n个独立随机变量X1,X2,...,Xn,且它们的期望和方差都存在,则它们的和S = X1+X2+...+Xn的分布近似于正态分布N(μ,σ^2),其中μ = nE(Xi)和σ^2 = nVar(Xi)。
现在考虑n个独立重复的伯努利试验,每次试验成功的概率为p,成功的次数X服从二项分布B(n,p)。我们可以将X表示为X = (Y1+Y2+...+Yn),其中Yi表示第i次试验是否成功,如果成功则取1,否则取0。因为每次试验都是独立的,所以Yi也是独立的随机变量。由于每次试验成功的概率为p,所以E(Yi) = p,Var(Yi) = p(1-p)。
根据中心极限定理,当n足够大时,X的分布近似于正态分布N(μ,σ^2),其中μ = np,σ^2 = np(1-p)。因此,我们可以用正态分布来近似二项分布,即B(n,p) ≈ N(np,np(1-p)),当n越大时近似程度越高。
为了验证中心极限定理,我们可以通过模拟数据来比较二项分布和正态分布的近似程度。具体来说,我们可以生成一组大小为n的二项分布样本,计算样本的均值和标准差,然后用这些统计量来构造一个正态分布。然后我们可以比较二项分布和正态分布的概率密度函数和累积分布函数的相似程度。
下面是利用Python代码进行模拟的示例:
``` python
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom, norm
# 设置参数
n = 100 # 试验次数
p = 0.5 # 成功概率
# 生成二项分布样本
sample = binom.rvs(n, p, size=10000)
# 计算样本的均值和标准差
mean = np.mean(sample)
std = np.std(sample)
# 构造正态分布
normal = norm(loc=mean, scale=std)
# 绘制概率密度函数和累积分布函数
x = np.linspace(0, n, 100)
plt.plot(x, binom.pmf(x, n, p), label='Binomial')
plt.plot(x, normal.pdf(x), label='Normal')
plt.legend()
plt.show()
plt.plot(x, binom.cdf(x, n, p), label='Binomial')
plt.plot(x, normal.cdf(x), label='Normal')
plt.legend()
plt.show()
```
运行上述代码,可以得到二项分布和正态分布的概率密度函数和累积分布函数的图像。可以看出,当n足够大时,二项分布和正态分布的近似程度很高,验证了中心极限定理的有效性。
阅读全文