python nltk 分词分句
时间: 2023-10-24 11:10:08 浏览: 163
NP_chunking_with_nltk:使用 NLTK 进行名词短语分块的基于 iPython 的教程。 随 PyCon 2015 海报展示而编写
使用nltk库进行分词和分句非常方便。首先需要安装nltk库,然后下载punkt模块,代码如下:
```python
import nltk
nltk.download('punkt')
```
接着就可以使用word_tokenize()函数进行分词,使用sent_tokenize()函数进行分句,示例代码如下:
```python
from nltk.tokenize import word_tokenize, sent_tokenize
text = "Hello world. How are you today?"
tokens = word_tokenize(text)
sentences = sent_tokenize(text)
print(tokens)
print(sentences)
```
输出结果为:
```
['Hello', 'world', '.', 'How', 'are', 'you', 'today', '?']
['Hello world.', 'How are you today?']
```
阅读全文