python知识图谱企业实体抽取代码
时间: 2023-06-28 22:12:03 浏览: 113
基于知识图谱的问答系统,BERT 做命名实体识别和句子相似度. 完整数据+代码 可直接运行
5星 · 资源好评率100%
以下是一个基于规则的 Python 代码示例,用于从文本中提取企业实体:
```python
import re
text = "今天在百度(Baidu)的总部工作。"
# 企业名称正则表达式
company_pattern = re.compile(r'[\u4e00-\u9fa5]{2,}(公司|集团|企业|股份有限公司|有限公司|股份公司)?')
# 替换中英文括号
text = text.replace('(', '(').replace(')', ')')
# 提取企业名称
companies = company_pattern.findall(text)
print(companies)
```
该示例使用了一个基于正则表达式的规则来匹配企业名称。在这个示例中,我们使用了一个简单的中文字符集合和一些常见的企业后缀来匹配企业名称。如果你需要更复杂的规则,可以根据你的需求进行修改。
注意,在这个示例中,我们将中文和英文括号都替换为了中文括号,以避免匹配时出现问题。
阅读全文