stata在生成虚拟值之后,求超过平均工资的不同种族人数占比
时间: 2024-09-28 13:13:42 浏览: 51
在Stata中,当你已经通过`generate`或`replace`命令生成了虚拟变量(也称作哑变量或虚拟编码,通常用于处理分类变量)后,可以结合之前处理工资数据的方法来计算各种族工资超过平均工资的人员占比。假设你已经有了种族虚拟变量,例如`race_1`、`race_2`等,可以按以下步骤操作:
1. 加载数据并检查虚拟变量已生成:
```stata
use your_dataset, clear
list race* salary, sepby(race)
```
2. 计算工资的平均值:
```
mean salary, by(race_)
```
这将得到每个种族对应的工资平均值。
3. 检查并筛选出工资超过平均工资的记录,这里需要根据你的虚拟变量来判断(比如`if salary > r(mean.salary)`替换`race_`)。
4. 使用条件计数(`summarize`)或`tabulate`命令对每个种族计数,区分超过平均工资的个体数:
```stata
summarize race_ (count if salary > r(mean.salary)), by(race_)
```
或者
```stata
tabulate race_ if salary > r(mean.salary)
```
5. 转换计数值为占比:
```stata
egen race_percent = pct(race_count), by(race_)
```
这将创建新的变量`race_percent`,显示各种族超过平均工资的员工占比。
阅读全文