''' 请在Begin和End中进行程序编写，不允许修改程序结构，不允许删除修改已存在的代码。当考生目录有中文电子版《红楼梦》小说txt的文件，利用jieba库，编程统计两部小说中人物出场的次数，并排除"什么","一个","我们","你们","起来","这里","出来","那里","怎么","不是","只见","没有","知道","两个", "一面","如今","自己","说道"18个词，输出人物出场次数的前十名，去掉分词中一个字的。结果保存在结果.txt文件中。 ''' import jieba excludes = {"什么","一个","我们","你们","起来","这里","出来","那里","怎么","不是","只见","没有","知道","两个","一面","如今","自己","说道"} fi = open("红楼梦.txt", "r", encoding='gb18030') fo = open("结果.txt","w") txt = fi.read() ######begin##### ######end##### items = list(counts.items()) items.sort(key=lambda x:x[1], reverse=True) fo.write("人物出场次数\n") for i in range(10): word, count = items[i] fo.write("{0:<10}{1:>5}\n".format(word, count)) fi.close() fo.close()

时间: 2023-06-29 21:18:28 浏览: 1000

好的，这是一个简单的 Python 代码实现：

import jieba

excludes = {"什么","一个","我们","你们","起来","这里","出来","那里","怎么","不是","只见","没有","知道","两个","一面","如今","自己","说道"}

fi = open("红楼梦.txt", "r", encoding='gb18030')
fo = open("结果.txt","w")

txt = fi.read()

######begin#####

words = jieba.lcut(txt)
counts = {}

for word in words:
    if len(word) == 1:
        continue
    elif word in excludes:
        continue
    else:
        counts[word] = counts.get(word, 0) + 1

items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)

fo.write("人物       出场次数\n")
for i in range(10):
    word, count = items[i]
    fo.write("{0:<10}{1:>5}\n".format(word, count))

######end#####

fi.close()
fo.close()

这个程序使用了 jieba 库对《红楼梦》小说进行了分词，统计了每个人物出现的次数，并排除了题目中要求排除的 18 个词语。最后将结果保存到了 "结果.txt" 文件中。

向AI提问

相关推荐

python使用jieba进行分词统计

全国计算机三级考试上机试题程序代码

全国计算机等级考试 二级C语言 辅 导 第二部分: C语言程序设计

三级PC试题：八位有符号数压缩程序设计

计算机三级PC技术：数组分组程序设计

计算机三级PC技术上机真题解答：解压缩程序

计算机等级考试：三级PC技术数组处理程序设计

三级PC技术南开100题-数组分类与计数程序

微机原理试题：寻找内存序列最大值与最小值程序设计

掌握C语言循环结构：预习与实战指南

CDGA考生的最后冲刺秘籍：权威专家的考前押题

【Linux文本处理工具全解】：LPIC-1考生的实用指南

C++编译器优化技巧：提升代码性能的GESP认证考题策略

数据结构与算法：重庆专升本试题中的应用挑战与7种解决方案

C++控制结构与函数：GESP二级考试的制胜秘籍

【数据库原理】：历年真题中的考点与解析技巧

Togaf 9架构基础：真题中的关键概念与术语，架构师必备知识

数字电路与计算机组成原理：重庆专升本试题中的硬件知识梳理与实践应用

urdfdom-1.0.4-9.el8.x64-86.rpm.tar.gz

大家在看

SD Specifications Part 1 - Physical Layer Specification 4.0

ORAN协议 v04.00

以下为转载Plasma工作原理介紹-plasma等离子处理

100万条虚拟游戏人物等级数据

集成运放电路-multisim14仿真教程

最新推荐

使用C语言编写圣诞表白程序

数据库课程设计 报告+程序代码

urdfdom-1.0.4-9.el8.x64-86.rpm.tar.gz

Telescan PE v1.54 资源包：PCIE设备管理的利器

2025年江苏扬州公交路线及站点矢量shp数据.zip

ASP.NET高级编程学习资料合集下载指南

个人信息保护全攻略：如何在网络安全法框架下确保用户数据安全

飞机票订票系统DFD

DWZ富客户端框架v1.0.1发布: 界面组件实现与源码下载

【揭秘车辆重识别】：深入理解VeRi-776数据集及其在深度学习中的关键作用（权威解析）

全国计算机等级考试二级C语言辅导第二部分: C语言程序设计

数据库课程设计报告+程序代码