jieba中文分词去除标点
时间: 2024-06-08 09:02:44 浏览: 209
jieba中文分词
jieba是Python中常用的一种中文分词工具,可以进行中文分词和去除标点等操作。如果想要去除标点符号,可以在分词时设置参数为cut_all=False,然后再对分词结果进行过滤。以下是一段示例代码:
```
import jieba
text = "今天天气真好,适合出去玩!"
seg_list = jieba.cut(text, cut_all=False) # 设置cut_all为False,表示精确模式分词
result = []
for word in seg_list:
if word != " " and word != "\n" and word != "\t" and word != "," and word != "!":
result.append(word)
print(result)
```
上述代码中,我们首先使用jieba.cut函数对text进行分词,将结果保存在seg_list中。接着,我们遍历seg_list,将其中不是空格、换行符、制表符和标点符号的单词添加到result列表中。最终得到的result列表就是去除了标点符号的分词结果。
阅读全文