现准备用 10000 元进行一次调查,以便估计某一特征的总体单元所占比例.采用二重抽样,第一重抽取各单元的档案资料 n'份然后将此n'份分为大小相等的两个层,再从各层抽出第二重实地调查的样本单元.若平均每一抽样单位的分层费用为 1元,而实地调查一个抽样单位的费用是 20 元如果层1的真实比例是 0.3,层2中的真实比例是0.6请估计最佳的n'和n以及所能达到的估计量的均方偏差的数值
时间: 2024-02-26 19:55:34 浏览: 21
根据二重抽样的方法,总体单元的比例可以估计为:
$\hat{P}=\frac{\sum_{i=1}^{2} \frac{N_{i}}{n_{i}} \hat{p}_{i}}{\sum_{i=1}^{2} \frac{N_{i}}{n_{i}}}$
其中,$N_1$和$N_2$分别为两个层中的总体单元数,$n_1$和$n_2$分别为抽取的样本单元数,$\hat{p}_1$和$\hat{p}_2$分别为两个层中的样本比例。
根据最小可达标准误公式,估计量的均方偏差可以估计为:
$MSE(\hat{P})=\frac{\sum_{i=1}^{2} \frac{N_{i}}{n_{i}} (1-\frac{n_{i}}{N_{i}}) \hat{p}_{i}(1-\hat{p}_{i})}{(\sum_{i=1}^{2} \frac{N_{i}}{n_{i}})^2}$
已知层1的真实比例是0.3,层2中的真实比例是0.6。为了达到最佳估计,需要使均方偏差最小化。因此,我们可以通过计算不同$n'$、$n$组合下的均方偏差来找到最佳的$n'$和$n$。
假设$n'$份资料中,层1和层2各有$n'_1$和$n'_2$份,则有:
$N_1=N_2=5000$
$n_1=n_2=500$
$n'_1+n'_2=n'$
为了方便计算,我们可以将总费用表示为:
$C=n'+20n$
则:
$20n=n'C^{-1}-(n'+n)$
$C^{-1}$为费用的倒数,$n'+n$为总样本量。
将这个式子带入原公式,可以得到估计量的均方偏差为:
$MSE(\hat{P})=\frac{0.3\times0.7}{500}+\frac{0.6\times0.4}{500}+\frac{0.3^2\times4700}{n'C}+\frac{0.6^2\times4700}{n'C}-\frac{2\times0.3\times0.7\times2500}{n'C}$
现在,我们可以通过计算不同$n'$、$n$组合下的均方偏差来找到最佳的$n'$和$n$。一般来说,我们会选择使均方偏差最小的组合。
请注意,为了保证结果的准确性,我们需要进行更多的计算和检验。