假设h在n=65的独立抽取样本上出现r=10个错误,真实错误率的90%置信区间是多少?单侧置信区间是多少?90%单侧区间是多少?
时间: 2024-02-29 13:54:48 浏览: 157
根据二项分布的公式,样本中出现r个错误的概率为:
P(r) = (n choose r) * p^r * (1-p)^(n-r)
其中,n为样本容量,p为真实错误率,(n choose r)表示从n个样本中选择r个样本的组合数。我们需要找到一个区间,使得这个区间包含真实错误率的90%的概率。设这个区间为[p1, p2],则有:
P(p1 <= p <= p2) = 0.9
为了求解这个区间,我们需要使用正态分布的近似。根据中心极限定理,当n足够大时,二项分布可以用正态分布来近似,即:
X = (r - np) / sqrt(np(1-p))
服从均值为0,方差为1的标准正态分布。其中,np是二项分布的均值,np(1-p)是方差。因此,有:
p̂ = r/n
X = (p̂ - p) / sqrt(p(1-p)/n)
我们可以使用标准正态分布的分位数来求出区间[p1, p2]。对于双侧置信区间,我们有:
P(-z1.645 <= X <= z1.645) = 0.9
其中,z1.645是标准正态分布的第97.5个百分位数,可以使用查表或计算机软件来获得。解出p的范围即为:
p1 = p̂ - z1.645 * sqrt(p̂(1-p̂)/n)
p2 = p̂ + z1.645 * sqrt(p̂(1-p̂)/n)
对于单侧置信区间,我们只需要找到一个边界p1或p2即可。对于左侧置信区间,我们有:
P(X <= z1.28) = 0.9
其中,z1.28是标准正态分布的第90个百分位数。解出p的下限即为:
p1 = p̂ - z1.28 * sqrt(p̂(1-p̂)/n)
对于右侧置信区间,我们有:
P(X >= z1.28) = 0.9
解出p的上限即为:
p2 = p̂ + z1.28 * sqrt(p̂(1-p̂)/n)
因此,这个样本中真实错误率的90%置信区间为[0.091, 0.231],双侧置信区间为[0.091, 0.231],左侧置信区间为[0, 0.178],右侧置信区间为[0.136, 1]。
阅读全文