python实体识别代码
时间: 2023-09-28 18:04:12 浏览: 97
lstm+crf、bilstm+crf 、LSTM CRF pytorch 命名实体识别代码
5星 · 资源好评率100%
以下是使用Python中的NLTK库进行实体识别的示例代码:
```python
import nltk
from nltk.tokenize import word_tokenize
from nltk.tag import pos_tag
from nltk.chunk import ne_chunk
def named_entity_recognition(text):
# 分词
tokens = word_tokenize(text)
# 词性标注
tagged = pos_tag(tokens)
# 命名实体识别
ne_chunked = ne_chunk(tagged)
# 输出命名实体
named_entities = []
for chunk in ne_chunked:
if hasattr(chunk, 'label'):
named_entities.append((chunk.label(), ' '.join(c[0] for c in chunk)))
return named_entities
# 示例文本
text = "Bill Gates is the CEO of Microsoft."
# 进行实体识别
entities = named_entity_recognition(text)
# 输出结果
print(entities)
```
输出结果为:
```
[('PERSON', 'Bill Gates'), ('ORGANIZATION', 'Microsoft')]
```
其中,每个命名实体由其实体类型和实体名称组成,例如`('PERSON', 'Bill Gates')`表示`Bill Gates`是一个人名实体。
阅读全文