stata自带妇女数据求不同种族妇女工资超过均值的占比
时间: 2024-09-28 14:10:15 浏览: 54
在Stata中,你可以使用内置的数据集来分析妇女工资差异。假设你有一个名为`female_workers`的数据集,其中包含工资(如`salary`)和种族(如`race`)等变量,你可以按照以下步骤来计算不同种族女性工资超过平均工资的占比:
1. 首先,加载数据集:
```
use female_workers
```
2. 计算工资的平均值:
```
mean salary
```
3. 筛选出工资超过平均值的女性记录:
```
keep if salary > _b[salary]
```
`_b[salary]`获取的是工资变量的平均值的估计系数。
4. 对于每个种族,计算其工资超过平均值的女性比例:
```
egen race_ratio = total(1), by(race)
```
`egen`命令会创建一个新的变量`race_ratio`,它表示每个种族工资超过平均值的人数占该种族总人数的比例。
5. 将比例转换为百分比:
```
replace race_ratio = race_ratio * 100
```
6. 最终,`race_ratio`就是你要找的各种族女性工资超过平均值的占比。
相关问题
stata已经生成超过均值的虚拟变量为1,求超过均值的不同种族人数占比
如果你想在Stata中找出超过均值的工资对于不同种族的百分比,你可以使用`tabulate`或`summarize`命令配合之前创建的虚拟变量。假设我们已经有`over_mean_race1`, `over_mean_race2`, 和 `over_mean_race3`这三个种族的虚拟变量,表示工资超过均值的女性。
以下是计算每个种族超过均值的人数比例的步骤:
1. 使用`tabulate`命令获取每个种族超过均值的计数,并计算比例:
```stata
tab over_mean_race1, count
tab over_mean_race2, count
tab over_mean_race3, count
```
这会显示每个种族有多少女性工资超过均值。
2. 然后将这些计数转换为百分比:
```stata
local race1_count : display %9.1f r(N) [r(N)*100]
di "Race 1 percentage: " race1_count "%"
local race2_count : display %9.1f r(N) [r(N)*100]
di "Race 2 percentage: " race2_count "%"
local race3_count : display %9.1f r(N) [r(N)*100]
di "Race 3 percentage: " race3_count "%"
```
`display`命令用于格式化百分比输出。
这样,你就得到了每个种族超过均值女性所占的百分比。
stata生成一个新变量,为0-1虚拟型变量,标记出工资是否均值。求出工资超过均值的妇女活动。全部妇女,三个种族的妇女,都要计算。
在Stata中,你可以使用`egen`命令和条件表达式来创建一个新的虚拟变量,这个变量表示工资是否超过了均值。首先,你需要确定当前数据集中的工资变量和女性的标识符。假设工资变量名为`wage`,性别标识符为`female`,并且种族变量有`race1`, `race2`, 和 `race3`。
以下是创建新的虚拟变量并分别计算各族妇女平均工资之上情况的步骤:
1. 计算全妇女人数和工资均值:
```stata
summarize wage if female == 1
```
2. 创建虚拟变量,如果工资大于均值,则赋值为1,否则为0:
```stata
gen over_mean = (wage > _b[wage]) if female == 1
```
`_b[wage]`是工资变量的样本均值估计值。
3. 对每个种族进行同样的操作:
- 对于`race1`:
```stata
egen race1_over_mean = (wage > _b[wage]) if female == 1 && race1 == 1
```
- 类似地,对`race2`和`race3`做相应修改,如:
```stata
egen race2_over_mean = (wage > _b[wage]) if female == 1 && race2 == 1
egen race3_over_mean = (wage > _b[wage]) if female == 1 && race3 == 1
```
现在,你已经有了新的虚拟变量,分别记录了全妇女人群、以及三个种族的妇女中,工资超过均值的比例。
阅读全文