import jieba data = open("三国演义.txt", encoding='utf8').read() dataLs = jieba.lcut(data) # 开始统计红人 spManyAlias = {'诸葛亮': '诸葛亮', "孔明": '诸葛亮', '卧龙': '诸葛亮', '曹操': '曹操', '曹阿蛮': '曹操', '曹孟德': '曹操'} specialPersonDict = dict() for person in dataLs: if person in spManyAlias: specialPersonDict[spManyAlias[person]] = \ specialPersonDict.get(spManyAlias[person], 0) + 1 # 将字典转换为列表进行降序排序 specialPersonDictLs = list(specialPersonDict.items()) specialPersonDictLs.sort(key=lambda x: x[1], reverse=True) print(specialPersonDictLs)在程序内部添加注释
时间: 2023-12-28 21:04:21 浏览: 108
jieba-0_jieba安装0.4.1_jieba-0.42.1.tar_jieba-0.42.1.tar.gz_jieba-
5星 · 资源好评率100%
以下是添加注释后的代码:
import jieba # 导入结巴分词库
# 读取《三国演义》文本文件,并使用结巴分词库对文本进行分词
data = open("三国演义.txt", encoding='utf8').read()
dataLs = jieba.lcut(data)
# 定义特定人物的别名
spManyAlias = {'诸葛亮': '诸葛亮', "孔明": '诸葛亮', '卧龙': '诸葛亮',
'曹操': '曹操', '曹阿蛮': '曹操', '曹孟德': '曹操'}
# 统计文本中出现的特定人物的出现次数
specialPersonDict = dict()
for person in dataLs:
if person in spManyAlias:
specialPersonDict[spManyAlias[person]] = specialPersonDict.get(spManyAlias[person], 0) + 1
# 将字典转换为列表进行降序排序
specialPersonDictLs = list(specialPersonDict.items())
specialPersonDictLs.sort(key=lambda x: x[1], reverse=True)
# 打印输出结果
print(specialPersonDictLs)
阅读全文