jieba分词去掉标点符号
时间: 2023-11-09 20:08:33 浏览: 255
可以使用Python中的jieba库来进行分词,并通过正则表达式去掉标点符号。示例代码如下:
```python
import re
import jieba
# 待分词的文本
text = "今天天气真好,我想出去玩!"
# 使用jieba进行分词
seg_list = jieba.cut(text)
# 去掉标点符号
result = []
for word in seg_list:
# 使用正则表达式去掉标点符号
word = re.sub(r'[^\w\s]', '', word)
if word != '':
result.append(word)
print(result)
# 输出:['今天', '天气', '真好', '我', '想', '出去', '玩']
```
在上述代码中,我们使用`jieba.cut()`函数对文本进行分词,然后使用正则表达式`re.sub()`去掉标点符号。最后将不为空的词语添加到结果列表中,即可得到分词结果。
阅读全文
相关推荐















