首页关于中文文本数据清洗中保留名词和动词的python代码

关于中文文本数据清洗中保留名词和动词的python代码

时间: 2024-05-11 21:17:06 浏览: 155

可以使用Python中的中文分词工具jieba来实现中文文本数据清洗，保留名词和动词。具体代码如下： ```python import jieba # 待清洗的文本 text = "我喜欢吃水果和蔬菜，每天都会去买新鲜的食材回来。" # 分词并标注词性 seg_list = jieba.posseg.cut(text) # 保留名词和动词 clean_text = "" for word, flag in seg_list: if flag.startswith("n") or flag.startswith("v"): clean_text += word print(clean_text) ``` 输出结果为："喜欢吃水果蔬菜每天买新鲜食材回来"，只保留了名词和动词。

阅读全文