python按关键词列表在中文文本数据中提取关键词
时间: 2023-10-07 13:09:58 浏览: 120
基于Python实现中文文本关键词抽取的三种方法.zip
可以使用Python中的中文分词库,例如jieba库,来对中文文本进行分词处理。然后再针对关键词列表,对分词结果进行筛选和统计。
以下是一个简单的示例代码:
```python
import jieba
# 加载关键词列表
keywords = ['关键词1', '关键词2', '关键词3']
# 加载文本数据
text = '这是一段中文文本,请在其中提取关键词。'
# 对文本进行分词处理
words = jieba.cut(text)
# 统计关键词在文本中出现的次数
counts = {}
for word in words:
if word in keywords:
counts[word] = counts.get(word, 0) + 1
# 输出关键词出现次数
for keyword in keywords:
print(keyword + ': ' + str(counts.get(keyword, 0)))
```
上述代码中,首先加载了一个关键词列表和一段中文文本。然后使用jieba库对文本进行分词处理,并统计关键词在分词结果中出现的次数。最后输出各个关键词的出现次数。
阅读全文