![](https://csdnimg.cn/release/download_crawler_static/3186152/bg9.jpg)
用 t 检验、符号检验、符号秩检验,Gini's Mean
Difference 是变量分布分散程度的一种稳健估计,计算公式为 ,对正态分布其期望值为 。
Trimmed Mean, (1/2)N 计算去掉最大(1/2)N 个和最小(1/2)N 个值后的平均值,(1/2)N 可以指
定为 1,2,3 或自定值,这是变量中心位置的一种稳健估计,但估计量本身不再服从正态分
布。Trimmed
Mean, (1/2)Percent 指定去掉最大、最小的百分之多少再计算均值。Winsorized Mean 是把最
大的(1/2)N 个替换成由大到小第(1/2)N+1 号值,把最小的(1/2)N 个替换成由小到大第(1/2)N
+1 个值,然后计算的均值,它也是一种稳健的均值估计。
图 28 GPA 分数的 QQ 图
图 29 身高的 QQ 图
图 30 GPA 分布直方图
图 31 左偏、右偏、轻尾、重尾的 QQ 图
在 Graphs 菜单中已选了直方图、盒形图,还可以作 QQ 图,即分位数-分位数图。图
29 为身高的正态 QQ 图,其中画出了班上 19 个学生的 19 个点,每个点的纵坐标为变量值,
而横坐标为该值的累计百分比频数对应的标准正态分位数。比如,身高最低的一个为 51.3,
其累计百分比频数(即 51.3 的经验分布函数值)为 5.3%,即身高小于 51.3 的占 5.3%,而
标准正态分布的 0.053 分
位数为-1.84570,所以此点的横坐标即-1.84570。如果身高服从正态分布,QQ 图的散点应大
致在一条直线附近变动。QQ 图的各种不同形状能够反映出变量分布的偏斜情况和重、轻尾
情况。在 QQ 图中也可以选观测、刷亮等。画出 QQ 图后选主菜单中的"Curves | QQ Ref
Line"可以为图中散点画一条拟和直线。
图 29 的身高的 QQ 图显示身高基本服从正态分布。如果我们 SASUSER.GPA 中 GPA 分数
的 QQ 图(图
28),就可以看到 GPA 的分布呈现左偏的情况。这是因为,在 QQ 图的左下端,GPA 散点的
走向比正态(图中直线)偏下,说明 GPA 分布的左尾比正态长;在 QQ 图的右上端,GPA
散点的走向比正态偏右下,说明 GPA 分布的右尾比正态短,即分布左偏。作为验证,可以
看一看图 30 的直方图。
图 32 参数密度估计设定