怎么用nltk加载本地文件
时间: 2023-09-20 07:07:31 浏览: 94
nltk_data corpora 离线下载
5星 · 资源好评率100%
你可以使用nltk库中的`corpus`模块来加载本地文件。下面是一个例子:
```python
from nltk.corpus import PlaintextCorpusReader
# 读取本地文件夹中的文本文件
corpus_root = '/path/to/local/folder'
corpus = PlaintextCorpusReader(corpus_root, '.*\.txt')
# 获取文件名列表
file_names = corpus.fileids()
# 获取文件内容
file_content = corpus.raw(file_names[0])
```
在上述代码中,我们首先导入了`PlaintextCorpusReader`类,并使用其构造函数来读取本地文件夹中所有的`.txt`文件。然后我们使用`fileids()`方法获取所有文件的文件名列表,使用`raw()`方法获取文件内容。你可以根据实际情况修改`corpus_root`变量来指定本地文件夹的路径,修改正则表达式来匹配不同的文件格式。
阅读全文