在sy6-8. txt文件中输入歌曲《我和我的祖国》的歌词:“我和我的祖国一刻也不能分割无论我走到哪里都流出一首赞歌我歌唱每一座高山我歌唱每一条河袅袅炊烟小小村落路上一道辙我最亲爱的祖国我永远紧依着你的心窝你用你那母亲的脉搏和我诉说我的祖国和我像海和浪花一朵浪是那海的赤子海是那浪的依托每当大海在微笑我就是笑的漩涡我分担着海的忧愁分享海的欢乐我最亲爱的祖国你是大海永不干涸永远给我碧浪清波心中的歌”,设计程序,读取文件内容,并使用jieba库进行中文分词,最后统计出现次数最多的5个词以及出现次数。
时间: 2024-02-12 11:05:36 浏览: 171
sy6-dac.zip
你可以使用Python编写一个程序来实现该功能,代码如下:
```python
import jieba
filename = 'sy6-8.txt'
with open(filename, 'r', encoding='utf-8') as f:
text = f.read()
words = list(jieba.cut(text))
word_count = {}
for word in words:
if len(word) > 1: # 只统计长度大于1的词
word_count[word] = word_count.get(word, 0) + 1
top5 = sorted(word_count.items(), key=lambda x: x[1], reverse=True)[:5]
print('出现次数最多的5个词:')
for word, count in top5:
print(word, count)
```
首先,我们打开歌词文件,并读取其中的内容。然后,使用jieba库对歌词进行中文分词,得到一个词语列表。接着,我们遍历词语列表,统计每个词语的出现次数,将其保存在字典word_count中。最后,使用sorted函数对字典按照值进行降序排序,并取出前5个元素作为出现次数最多的词语。最后输出这5个词语以及它们的出现次数。
阅读全文