把主申请人名称重新分类,比如“xxx公司”分为企业,“xxx大学”分为高校,“xxx研究所”分为科研机构,日文那些分为其他
时间: 2023-11-21 15:04:02 浏览: 37
可以使用Stata中的字符串处理命令和条件语句来实现对主申请人名称的重新分类。
首先,需要将主申请人名称中的日文字符串筛选出来,可以使用正则表达式进行匹配。假设主申请人名称存储在变量`name`中,则可以使用以下命令新建一个变量`japanese`,并将其中含有日文字符串的名称标记为1,其他名称标记为0:
```
gen japanese = regexm(name, "[\u3000-\u9FFF]")
```
接下来,可以使用`egen`命令将主申请人名称分类为企业、高校、科研机构和其他。假设分类后的结果存储在变量`category`中,则可以使用以下命令:
```
egen category = group(name, (japanese==0)*\
(name=="*公司" | name=="*厂" | name=="*工厂" | name=="*有限公司" | name=="*责任公司") +\
(japanese==0)*\
(name=="*大学" | name=="*学院" | name=="*学校" | name=="*教育机构" | name=="*师范学校" | name=="*职业学校" | name=="*研究生院" | name=="*研究所") +\
(japanese==0)*\
(name=="*研究院" | name=="*中心" | name=="*实验室" | name=="*协会" | name=="*委员会" | name=="*联合会" | name=="*协同研究组") +\
(japanese==1), label)
```
上述命令中,首先根据`japanese`变量和主申请人名称中的特定字符串条件,将企业、高校和科研机构分类为三个不同的组。最后,将含有日文字符串的名称归为“其他”组。
需要注意的是,上述命令中使用了Stata的“通配符”符号`*`,表示可以匹配任意字符。另外,如果主申请人名称中包含空格或其他特殊字符,可能需要使用`regexr()`函数或其他字符串处理函数进行处理。
相关推荐
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)