jieba库中分词去掉标点符号
时间: 2023-11-22 11:50:02 浏览: 333
jieba分词详解和实践
jieba库中可以通过使用自定义字典和停用词表来实现分词去掉标点符号的功能。具体步骤如下:
1.导入jieba库和string库(string库中包含了所有的标点符号)。
```python
import jieba
import string
```
2.使用jieba库的lcut方法对文本进行分词,并将结果存储在列表中。
```python
text = "今天是个好日子,心想的事儿都能成。"
word_list = jieba.lcut(text)
```
3.使用列表推导式和string库中的punctuation属性来去掉标点符号。
```python
word_list = [word for word in word_list if word not in string.punctuation]
```
4.将去掉标点符号后的分词结果转换为字符串输出。
```python
result = ' '.join(word_list)
print(result) # 输出:今天 是个 好 日子 心想 的 事儿 都 能 成
```
阅读全文