如何用stata按“gmat”、“英语”、“经验”对“学费外”和“起薪”进行分组,绘制箱线图,并对你所绘制的图进行简单分析。
时间: 2024-08-14 16:03:54 浏览: 96
现代医学统计方法与STATA应用
在Stata中,你可以按照"GPA"(假设是gmat分数)、"英语水平"和"工作经验"这三个变量对"学费之外"(可能是指奖学金或其他非学费收入)以及"起薪"进行分组并创建箱线图。这里是一个基本步骤:
1. **数据检查**:
首先,确认你的数据集已经包含了这些变量(gmat, 英语, 经验, 学费外, 起薪),并且它们的数据类型是数值型。
2. **导入数据**:
```stata
use your_dataset_name, clear
```
3. **分组箱线图**:
使用`xtile`命令将数据根据指定变量分成几组,然后用`bysort`命令按组进行统计并画出箱线图。例如,如果想把GPA分为五个等距的区间,可以这样做:
```stata
xtile gmat_groups, n(5)
bysort gmat_groups gmat_english_experience: summarize tuition_outside salary
graph box tuition_outside salary if inrange(gmat_groups,1/5), over(gmat_groups) layout(2,1)
```
这里`ntile`设置为5表示GPA每5分一组,`graph box`用于生成箱线图,`inrange`用来限制结果只显示在GPA组内的数据。
4. **图形解读**:
- 箱线图展示了每个分组内学费外和起薪的分布情况。中位数由箱体顶部和底部线条表示,箱体内上、下边缘代表第一四分位数和第三四分位数,异常值则由点标记。
- 观察不同GPA组、英语水平和工作经验水平下的学费外和起薪差异,可能存在趋势或模式,如高GPA和英语水平的学生可能有更高的起薪和较少的学费外。
阅读全文