4.某地区有行政村 2000个,为了调查该地区村办工业的年产值,进行二重抽样.首先从全部行政村中简单随机地抽取 400 个,调查该村有几家村办工业,然后以拥有企亚数为规模测度的 PPS 抽样抽出 30个村调查,调查结果如比小下: 层 第一重抽样 第二重样本村年产值(万元) 1 75 4.5,5.5 2 90 10.0,11.0,12.0,13.0,14.0 3 120 11.0,11.5,12.5,13.0,14.0,14.5,15.0,16.0,16.5 4 60 18.0,18.5,19.0,19.5,20.0,21.0,22.0 5 35 19.0,20.0,21.0,22.0, 6 20 23.0,24.0,24.5 试依此调查结果估计该地区村办工业的年总产值,并给出置信度为95%的置信区间估计.
时间: 2023-09-18 09:13:08 浏览: 109
首先计算第一重抽样的抽样比:
抽样比 $k=\frac{400}{2000}=0.2$
然后计算第二重抽样的权重:
对于每个层 $h$,权重 $w_h=\frac{N_h}{n_h}$,其中 $N_h$ 为该层的总村庄数,$n_h$ 为第一重抽样中该层被抽到的村庄数。
层 $N_h$ $n_h$ $w_h$
1 2000 75 26.67
2 2000 90 22.22
3 2000 120 16.67
4 2000 60 33.33
5 2000 35 57.14
6 2000 20 100.00
然后计算每个村庄的抽样概率:
对于第二重抽样中的每个村庄 $i$,抽样概率 $p_i=k\times w_h$,其中 $h$ 为该村庄所在层。
根据抽样结果,我们可以计算出每个样本的权重,进而计算出每个村庄的总产值的无偏估计 $\hat{t}$:
$\hat{t}=\sum_{i=1}^{30}\frac{y_i}{p_i}$
其中 $y_i$ 为第二重抽样中第 $i$ 个村庄的总产值,$p_i$ 为第二重抽样中第 $i$ 个村庄的抽样概率。
村庄 总产值(万元) $p_i$ $y_i/p_i$
1 4.5,5.5 0.0400 275.00
2 10.0,11.0,12.0,13.0,14.0 0.0467 460.22
3 11.0,11.5,12.5,13.0,14.0,14.5,15.0,16.0,16.5 0.0625 626.40
4 18.0,18.5,19.0,19.5,20.0,21.0,22.0 0.0333 708.33
5 19.0,20.0,21.0,22.0 0.0196 2387.76
6 23.0,24.0,24.5 0.0100 2465.00
总计 $\hat{t}=8522.11$
样本的方差估计量为:
$\hat{Var}(\hat{t})=\sum_{i=1}^{30}\frac{(y_i-\hat{t}p_i)^2}{p_i(n_h-1)}$
其中 $n_h$ 为第一重抽样中层 $h$ 的样本数量。
根据样本的方差估计量,我们可以计算出样本的标准误:
$SE(\hat{t})=\sqrt{\hat{Var}(\hat{t})}=188.92$
根据中心极限定理,$\hat{t}$ 的分布近似为正态分布,因此可以构建置信区间:
$\hat{t}\pm z_{\alpha/2}\times SE(\hat{t})$
其中 $z_{\alpha/2}=1.96$,$\alpha=0.05$。
因此,置信度为95%的置信区间估计为:
$8522.11\pm 1.96\times 188.92=[8152.17,8892.05]$万元。
阅读全文