遍历“C:\Users\84297\Desktop\爬虫\data”路径中的txt文件并进行分词的代码怎么写
时间: 2023-03-29 18:04:28 浏览: 81
遍历某文件夹下的 .txt 文件
4星 · 用户满意度95%
你可以使用Python中的os和jieba库来实现这个功能。具体代码如下:
```python
import os
import jieba
# 遍历指定路径下的所有txt文件
def traverse_folder(path):
for root, dirs, files in os.walk(path):
for file in files:
if file.endswith('.txt'):
file_path = os.path.join(root, file)
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
# 对文件内容进行分词
seg_list = jieba.cut(content)
print('/'.join(seg_list))
# 调用函数进行遍历和分词
traverse_folder(r'C:\Users\84297\Desktop\爬虫\data')
```
这段代码会遍历指定路径下的所有txt文件,并对文件内容进行分词,最后输出分词结果。
阅读全文