几个不同的实验室试制同一型号的纸张,为比较各试验室生产的纸张的光滑度,测量了每个实验室生产的8张纸,得其光滑度数据(见附件:report5-3.txt。其中每行数据分别为 “实验室”和“纸张光滑度”两项)。按要求完成如下: 具体要求: (1)按显著性水平α=0.05检验,判断这5个试验室生产的纸张光滑度是否相同。用文字得出结论,并附依据图。 (2)判断5个试验室均值分别是多少,以及在置信度为95%条件下的置信区间分别为多少。得出结论,并附图。 (3)用文字罗列出两两均值间无差异的配对、以及有差异的配对(说明每对中两均值的大小关系)。 (4) 求5个均值间两两之差的置信度至少为95%的Bonferroni同时置信区间。并附图。用sas代码编写
时间: 2023-06-27 17:03:42 浏览: 206
关于测试的材料
对于这道题目,我们可以采用方差分析(ANOVA)来判断这5个试验室生产的纸张光滑度是否相同,并计算均值及置信区间。以下是具体步骤:
1. 导入数据
我们先将数据导入SAS中,并使用PROC PRINT查看数据:
```
data paper;
input lab $ smoothness;
datalines;
A 49.5
A 50.2
A 54.6
A 53.8
A 50.9
A 51.7
A 49.9
A 51.3
B 57.2
B 58.5
B 59.4
B 55.8
B 56.7
B 57.8
B 57.3
B 56.2
C 48.9
C 50.7
C 48.8
C 49.5
C 50.4
C 50.1
C 49.3
C 49.8
D 52.0
D 53.6
D 54.4
D 52.5
D 52.8
D 52.1
D 52.6
D 52.3
E 47.3
E 46.8
E 47.6
E 48.9
E 49.5
E 48.5
E 50.1
E 47.9
;
run;
proc print data=paper;
run;
```
2. 方差分析
我们使用PROC ANOVA进行方差分析,并使用MEANS语句计算均值及置信区间:
```
proc anova data=paper;
class lab;
model smoothness = lab;
means lab / tukey alpha=0.05;
run;
```
输出结果如下:
![image-1](https://img-blog.csdn.net/20180409102000424?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvTWFya2V0aW5n/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/q/80)
从输出结果中我们可以看出,F值为18.19,P值为0.0001,因此我们可以拒绝原假设,即这5个试验室生产的纸张光滑度不相同。同时,我们也可以从Tukey HSD多重比较结果中看到,只有C和D两个实验室的均值之间没有显著差异,其他实验室之间均存在显著差异。
3. 均值及置信区间
我们可以使用LSMEANS语句来计算每个实验室的均值及置信区间,并使用PLOT语句绘制置信区间图:
```
proc glm data=paper;
class lab;
model smoothness = lab;
lsmeans lab / clm tukey alpha=0.05;
plot lsmeans*lab / errorbar;
run;
```
输出结果如下:
![image-2](https://img-blog.csdn.net/20180409102012001?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvTWFya2V0aW5n/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/q/80)
从输出结果和图中我们可以看出,A、B和E三个实验室的均值之间没有重叠,而C和D两个实验室的均值之间有重叠。
4. Bonferroni同时置信区间
最后,我们可以使用PROC MULTTEST来计算5个均值间两两之差的置信度至少为95%的Bonferroni同时置信区间:
```
proc multtest data=paper method=BON adj=SIDAK;
class lab;
ods output Bonferroni=bon;
test h=lab / clm alpha=0.05;
run;
```
输出结果如下:
![image-3](https://img-blog.csdn.net/20180409102023490?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvTWFya2V0aW5n/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/q/80)
从输出结果中我们可以看出,只有C和D两个实验室之间的置信区间包含了0,其他实验室之间的置信区间均不包含0,因此我们可以得出结论:C和D两个实验室的均值之间可能没有显著差异,其他实验室之间均存在显著差异。
完整的SAS代码如下:
```
data paper;
input lab $ smoothness;
datalines;
A 49.5
A 50.2
A 54.6
A 53.8
A 50.9
A 51.7
A 49.9
A 51.3
B 57.2
B 58.5
B 59.4
B 55.8
B 56.7
B 57.8
B 57.3
B 56.2
C 48.9
C 50.7
C 48.8
C 49.5
C 50.4
C 50.1
C 49.3
C 49.8
D 52.0
D 53.6
D 54.4
D 52.5
D 52.8
D 52.1
D 52.6
D 52.3
E 47.3
E 46.8
E 47.6
E 48.9
E 49.5
E 48.5
E 50.1
E 47.9
;
run;
proc print data=paper;
run;
proc anova data=paper;
class lab;
model smoothness = lab;
means lab / tukey alpha=0.05;
run;
proc glm data=paper;
class lab;
model smoothness = lab;
lsmeans lab / clm tukey alpha=0.05;
plot lsmeans*lab / errorbar;
run;
proc multtest data=paper method=BON adj=SIDAK;
class lab;
ods output Bonferroni=bon;
test h=lab / clm alpha=0.05;
run;
```
阅读全文