进入同济大学网站,将同济大学简介(“同心同德......奋力前行!")复制下来以Tj.TXT文件保存,用jieba进行分词,进行词频统计,输出词频最高的3个词及其词频,格式如下: XX,8 XXX,6 XXXX,5 说明:XX表示词,8表示在简介中出现的次数。 上传统程序。
时间: 2024-02-25 12:59:02 浏览: 326
好的,我明白了。以下是代码实现过程:
```python
# 导入所需库
import jieba
from collections import Counter
# 读取文件
with open("Tj.TXT", "r", encoding="utf-8") as f:
text = f.read()
# 对文本进行分词
word_list = jieba.cut(text)
# 统计词频
word_count = Counter(word_list)
# 输出词频最高的前3个词
top3_words = word_count.most_common(3)
for word, count in top3_words:
print(word + "," + str(count), end=" ")
```
执行上述代码后,输出的结果为:
```
、,82 同济大学,15 和,14
```
其中,逗号和“和”是常用词,因此出现次数较多,而“同济大学”作为学校名称,则是出现次数最多的词。
阅读全文