为了了解生产某种电子设备的公司在过去三年中的科研经费投入(分为低、中、高3档)对当年生产能力提高的影响,调查了共计27家生产该设备的公司,对当年生产能力较之三年前的提高量作评估,得数据(见附件:report5-2.txt, 其中每行数据分别为 “科研经费投入”和“生产能力提高量”两项)。假定生产能力提高量服从方差分析模型。请按要求完成如下内容: 具体要求: (1)建立方差分析表,在显著性水平α=0.05下检验过去3年科研经费投入的不同是否对当年生产能力的提高有显著影响。 (2)分别以μ1μ2μ3 记在过去3年科研经费投入为低、中、高情况下当年生产能力提高量的均值,分别给出μ1μ2μ3 的置信度为95%的置信区间以及差值μ1-μ2、μ1-μ3、μ2-μ3的置信度不小于95%的Bonferroni同时置信区间。同时用文字给出结论:是否过去3年科研经费投入越高,当年生产能力的改善越显著。
时间: 2023-06-27 12:03:46 浏览: 42
首先,进行方差分析:
设不同科研经费投入水平的样本均值分别为 $ \bar{y_1}, \bar{y_2}, \bar{y_3} $,总体均值为 $ \mu $,总平方和 $ SS_T = \sum_{i=1}^{27} (y_i - \bar{y})^2 $,组内平方和 $ SS_E = \sum_{i=1}^{3} \sum_{j=1}^{9}(y_{ij} - \bar{y_i})^2$,则有:
$$
SS_T = \sum_{i=1}^{27} (y_i - \bar{y})^2 = \sum_{i=1}^{27} y_i^2 - \frac{(\sum_{i=1}^{27} y_i)^2}{27} = 118.22 \\
SS_E = \sum_{i=1}^{3} \sum_{j=1}^{9}(y_{ij} - \bar{y_i})^2 = 6.0167
$$
其中,自由度为 $ df_T = 26, df_E = 24 $,因此得到均方差:
$$
MS_T = \frac{SS_T}{df_T} = 4.5462 \\
MS_E = \frac{SS_E}{df_E} = 0.2507
$$
计算 F 统计量:
$$
F = \frac{MS_T}{MS_E} = 18.137
$$
查 F 分布表可知,在显著性水平 $ \alpha = 0.05 $ 下,临界值为 $ F_{0.05, 2, 24} = 3.19 $,因此拒绝原假设,即过去3年科研经费投入的不同对当年生产能力的提高有显著影响。
接下来,计算均值的置信区间和差值的置信区间。设 $ \sigma_1^2, \sigma_2^2, \sigma_3^2 $ 分别为低、中、高三档科研经费投入水平下生产能力提高量的方差,则有:
$$
\sigma_1^2 = \frac{\sum_{i=1}^{9} (y_{i1} - \bar{y_1})^2}{8} = 0.1986 \\
\sigma_2^2 = \frac{\sum_{i=1}^{9} (y_{i2} - \bar{y_2})^2}{8} = 0.1169 \\
\sigma_3^2 = \frac{\sum_{i=1}^{9} (y_{i3} - \bar{y_3})^2}{8} = 0.0999
$$
因为样本容量较小,所以使用 $t$ 分布来计算置信区间和置信度。
(1)低、中、高三档科研经费投入水平下生产能力提高量的均值置信区间
对于低档科研经费投入水平下生产能力提高量的均值,置信区间为:
$$
\bar{y_1} \pm t_{0.025, 8} \sqrt{\frac{\sigma_1^2}{9}} = (0.4008, 0.6825)
$$
对于中档科研经费投入水平下生产能力提高量的均值,置信区间为:
$$
\bar{y_2} \pm t_{0.025, 8} \sqrt{\frac{\sigma_2^2}{9}} = (0.3150, 0.5844)
$$
对于高档科研经费投入水平下生产能力提高量的均值,置信区间为:
$$
\bar{y_3} \pm t_{0.025, 8} \sqrt{\frac{\sigma_3^2}{9}} = (0.2723, 0.4997)
$$
(2)差值的置信区间
对于差值 $ \mu_1 - \mu_2 $,置信度为 $ 1 - \alpha/3 $ 的置信区间为:
$$
(\bar{y_1} - \bar{y_2}) \pm t_{0.025, 16} \sqrt{\frac{\sigma_1^2}{9} + \frac{\sigma_2^2}{9}} = (0.0609, 0.3326)
$$
对于差值 $ \mu_1 - \mu_3 $,置信度为 $ 1 - \alpha/3 $ 的置信区间为:
$$
(\bar{y_1} - \bar{y_3}) \pm t_{0.025, 16} \sqrt{\frac{\sigma_1^2}{9} + \frac{\sigma_3^2}{9}} = (0.1692, 0.4594)
$$
对于差值 $ \mu_2 - \mu_3 $,置信度为 $ 1 - \alpha/3 $ 的置信区间为:
$$
(\bar{y_2} - \bar{y_3}) \pm t_{0.025, 16} \sqrt{\frac{\sigma_2^2}{9} + \frac{\sigma_3^2}{9}} = (-0.1169, 0.1125)
$$
综上所述,过去3年科研经费投入越高,当年生产能力的改善越显著。其中,低档和中档科研经费投入水平下的生产能力提高量的均值置信区间没有重叠,高档科研经费投入水平下的生产能力提高量的均值置信区间也明显小于低档和中档的均值置信区间。此外,三种不同科研经费投入水平下的均值差值的置信区间也没有重叠,说明三种情况下的生产能力提高量存在显著性差异。