jieba分词 去标点符号和表情付符号
时间: 2023-12-11 10:33:59 浏览: 234
以下是使用jieba分词去除标点符号和表情符号的示例代码:
```python
import jieba
import re
# 定义需要处理的字符串
text = "今天天气真好![太阳]"
# 使用正则表达式去除标点符号和表情符号
text = re.sub("[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()【】]+", "", text)
text = re.sub("\[.*?\]", "", text)
# 使用jieba分词进行分词
seg_list = jieba.cut(text)
# 输出分词结果
print(" ".join(seg_list))
```
运行以上代码,输出结果为:
```
今天天气 真好
```
阅读全文