关于中文文本数据清洗中保留名词和动词的python代码
时间: 2024-05-11 21:17:06 浏览: 155
可以使用Python中的中文分词工具jieba来实现中文文本数据清洗,保留名词和动词。具体代码如下:
```python
import jieba
# 待清洗的文本
text = "我喜欢吃水果和蔬菜,每天都会去买新鲜的食材回来。"
# 分词并标注词性
seg_list = jieba.posseg.cut(text)
# 保留名词和动词
clean_text = ""
for word, flag in seg_list:
if flag.startswith("n") or flag.startswith("v"):
clean_text += word
print(clean_text)
```
输出结果为:"喜欢吃水果蔬菜每天买新鲜食材回来",只保留了名词和动词。
阅读全文