按公司分类(id)用stata计算各个公司TFP_OP回归15-17年平均水平所需要的年数(大于等于即可)
时间: 2024-11-18 16:16:44 浏览: 45
在Stata中,你可以通过以下步骤来计算每个公司的TFP(全要素生产率,Total Factor Productivity)在2015-2017年的平均值,并确定达到这个水平所需的最短年限(如果数据允许,假设每年的数据都是连续的)。这里假设你有一个包含公司ID、年份及TFP数据的面板数据集。
1. 首先,加载数据到Stata中,例如你的数据集叫做`mydata`:
```
use mydata, clear
```
2. 确保你的数据已经按年份排序,并且公司ID是唯一的:
```
sort year company_id
```
3. 计算每个公司在2015-2017年期间的TFP平均值(这里假设TFP变量名是`tfp`):
```
by company_id: egen avg_tfp_15to17 = mean(tfp), time(year)
```
这将创建一个新的变量`avg_tfp_15to17`,其中存储了每个公司在这三年内的TFP平均值。
4. 接下来,你需要找到每个公司首次达到或超过这个平均值的年份。为此,可以遍历数据,检查是否有年份满足条件。这可以通过编写循环和条件判断来完成,但这通常不是一个直接内置的统计命令。不过,你可以在外部编程语言如Python中做这个操作,然后把结果导入到Stata中。
5. 如果你不想自己编写循环,你可以尝试使用`egen`命令的`if`选项,但它可能比较复杂,因为Stata对于复杂的筛选条件可能不够灵活。在这种情况下,你可能需要借助于外部脚本或利用其他工具如Python或R。
如果你选择Python作为辅助工具,可以用pandas读取数据,处理后再导回Stata:
```python
import pandas as pd
# ... (类似上述步骤1-3) ...
# 使用pandas查找每个公司的首次达标年份
df_pandas = pd.read_stata('mydata.dta')
first_year = df_pandas.groupby('company_id')['year', 'tfp'].apply(
lambda x: x.loc[x['tfp'] >= avg_tfp_15to17[x.name].values[0], 'year'].min()
)
# 将结果保存回Stata文件
pd.DataFrame({'company_id': first_year.index, 'years_to_average': first_year}).to_stata('output_file.dta', write_index=False)
```
最后,记得运行`use output_file.dta`来查看结果,并在Stata中确认数据是否符合你的需求。
阅读全文