如何将txt的文本文件导入python中,文件地址为:C:\Users\Admin\Desktop\jiba.txt,并且基于jieba实现词频统计
时间: 2023-10-23 10:24:44 浏览: 77
用Python中的jieba对文章进行词频统计
你可以使用以下代码将txt文件导入Python中并基于jieba实现词频统计:
```python
import jieba
# 打开txt文件
with open('C:/Users/Admin/Desktop/jiba.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba分词
words = jieba.lcut(text)
# 统计每个词出现的次数
word_count = {}
for word in words:
if len(word) == 1: # 仅统计长度大于1的词
continue
word_count[word] = word_count.get(word, 0) + 1
# 按词频从高到低排序
sorted_word_count = sorted(word_count.items(), key=lambda x: x[1], reverse=True)
# 输出前10个高频词
for word, count in sorted_word_count[:10]:
print('{}: {}'.format(word, count))
```
其中,`open()`函数用于打开文件,`jieba.lcut()`函数用于分词,`sorted()`函数用于排序。你需要将文件路径中的反斜杠`\`改为正斜杠`/`,或者在反斜杠前加上一个额外的反斜杠,如`C:\\Users\\Admin\\Desktop\\jiba.txt`。
阅读全文