首页python 一个程序,读出“三国演义.txt”文件中的三国演义全文,将常见人名进行去重后生成词云,并列出词频最高的10-20个词,并形成词云(可以有不同的形状)。

python 一个程序,读出“三国演义.txt”文件中的三国演义全文,将常见人名进行去重后生成词云,并列出词频最高的10-20个词,并形成词云(可以有不同的形状)。

时间: 2023-08-07 09:04:16 浏览: 194

以下是一个Python程序，它将读取“三国演义.txt”文件中的全文并使用jieba分词库进行分词和去重处理。然后，程序将使用wordcloud库生成词云，并使用matplotlib库显示结果。 ```python import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt # 读取文件 with open('三国演义.txt', 'r', encoding='utf-8') as f: text = f.read() # 分词 words = jieba.lcut(text) # 去除停用词和单个字 stopwords = ['，', '。', '、', '：', '；', '！', '？', '《', '》', '（', '）', '【', '】', '一', '了', '的', '在', '是', '和', '有', '人', '他', '他们', '你', '我们', '这', '那', '但'] words = [word for word in words if word not in stopwords and len(word) > 1] # 去重 unique_words = list(set(words)) # 计算词频 word_freq = {} for word in unique_words: word_freq[word] = words.count(word) # 排序 sorted_words = sorted(word_freq.items(), key=lambda x: x[1], reverse=True) # 输出词频最高的10-20个词 for word, freq in sorted_words[10:20]: print(word, freq) # 生成词云 wordcloud = WordCloud(font_path='simhei.ttf', background_color='white', width=800, height=600, max_words=200, mask=plt.imread('mask.png')) wordcloud.generate_from_frequencies(word_freq) # 显示词云 plt.imshow(wordcloud) plt.axis('off') plt.show() ``` 注意：在运行此程序之前，您需要安装jieba，wordcloud和matplotlib库，并将“三国演义.txt”文件和一个词云形状图像文件（例如“mask.png”）放在相同的目录下。您还可以更改程序中使用的停止词列表和其他参数以调整词云生成器的行为。

阅读全文

相关推荐

python三国演义人名词云: 设计一个程序，读出“三国演义.txt”文件中的三国演义全文，将常见人名进行去重后生成词云，并列出词频最高的10-20个词，并形成词云（可以有不同的形状）。例：'玄德'，'刘备','玄德曰','刘皇叔','皇叔'都是同一个人。任务拓展：利用列表或字典来存储同一个人。学会修改对形成的词云或字典来储存同一人完整代码

代码运行后，会生成一个形状为矩形的词云图，其中包含了三国演义中出现频率最高的人名。如果要修改对同一人名的储存方式，可以在遍历人名列表时，使用一个字典来记录同一人名的列表。具体实现方式可以参考代码中的 ...

任务二：三国演义人名词云。设计一个程序，读出“Romance of the Three Kingdoms.txt”文件中的三国演义全文，将常见人名进行去重后生成词云，并列出词频最高的 10-20 个词，并形成词云（可以有不同的形状）。例：'玄德'，'刘备','玄德曰','刘皇叔','皇叔'都是同一个人

以下是实现该任务的Python代码： ...需要注意的是，上述代码中使用了一个字体文件msyh.ttc，需要提前下载并放置到代码所在的目录下。同时，需要准备一个形状为mask.png的图片作为词云的形状，可以使用任意形状的图片。

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通全年可省5,000元立即开通

大家在看

ISO 16845-1-Part 1-Data link layer and physical signalling-2016

私信博主，可免费获得该标准！！！ ISO 16845-1:2016 Road vehicles — Controller area network (CAN) conformance test plan — Part 1: Data link layer and physical signalling ISO 16845-1:2016规定了ISO 11898-1中标准化的CAN数据链路层和物理信令的一致性测试计划。这包括经典的CAN协议以及CAN FD协议。

RealityCapture中文教程

最新推荐

Vim pythonmode PyLint绳Pydoc断点从框.zip

python

springboot138宠物领养系统的设计与实现.zip

关键词：冷热电联供；CHP机组；热泵；冰储冷空调；需求响应参考文献：《基于综合需求响应和奖惩阶梯型碳交易的综合能源系统优化调度》《计及需求响应和阶梯型碳交易机制的区域综合能源系统优化运行》碳交易机

包含300个可选插件rails git macOS hub docker homebrew node php pyth.zip

python

springboot148江理工文档管理系统的设计与实现.zip

Terraform AWS ACM 59版本测试与实践

资源摘要信息:"本资源是关于Terraform在AWS上操作ACM（AWS Certificate Manager）的模块的测试版本。Terraform是一个开源的基础设施即代码（Infrastructure as Code，IaC）工具，它允许用户使用代码定义和部署云资源。AWS Certificate Manager（ACM）是亚马逊提供的一个服务，用于自动化申请、管理和部署SSL/TLS证书。在本资源中，我们特别关注的是Terraform的一个特定版本的AWS ACM模块的测试内容，版本号为59。在AWS中部署和管理SSL/TLS证书是确保网站和应用程序安全通信的关键步骤。ACM服务可以免费管理这些证书，当与Terraform结合使用时，可以让开发者以声明性的方式自动化证书的获取和配置，这样可以大大简化证书管理流程，并保持与AWS基础设施的集成。通过使用Terraform的AWS ACM模块，开发人员可以编写Terraform配置文件，通过简单的命令行指令就能申请、部署和续订SSL/TLS证书。这个模块可以实现以下功能： 1. 自动申请Let's Encrypt的免费证书或者导入现有的证书。 2. 将证书与AWS服务关联，如ELB（Elastic Load Balancing）、CloudFront和API Gateway等。 3. 管理证书的过期时间，自动续订证书以避免服务中断。 4. 在多区域部署中同步证书信息，确保全局服务的一致性。测试版本59的资源意味着开发者可以验证这个版本是否满足了需求，是否存在任何的bug或不足之处，并且提供反馈。在这个版本中，开发者可以测试Terraform AWS ACM模块的稳定性和性能，确保在真实环境中部署前一切工作正常。测试内容可能包括以下几个方面： - 模块代码的语法和结构检查。 - 模块是否能够正确执行所有功能。 - 模块与AWS ACM服务的兼容性和集成。 - 模块部署后证书的获取、安装和续订的可靠性。 - 多区域部署的证书同步机制是否有效。 - 测试异常情况下的错误处理机制。 - 确保文档的准确性和完整性。由于资源中没有提供具体的标签，我们无法从中获取关于测试的详细技术信息。同样，由于只提供了一个文件名“terraform-aws-acm-59-master”，无法得知该模块具体包含哪些文件和代码内容。然而，文件名暗示这是一个主版本（master），通常意味着这是主要的、稳定的分支，开发者可以在其上构建和测试他们的配置。总之，terraform-aws-acm-59是Terraform的一个AWS ACM模块的测试版本，用于自动化管理和部署SSL/TLS证书。这个模块能够简化证书生命周期的管理，并提高与AWS服务的集成效率。测试工作主要是为了验证版本59的模块是否正常工作，并确保其在真实场景中可靠地执行预期功能。"

【HS1101湿敏电阻全面解析】：从基础知识到深度应用的完整指南

# 摘要 HS1101湿敏电阻作为湿度监测的重要元件，在环境监测、农业、工业等多个领域都有广泛应用。本文首先对湿敏电阻的基本概念及其工作原理进行了概述，接着详细探讨了其特性参数，如响应时间、灵敏度以及温度系数等，并针对HS1101型号提供了选型指南和实际应用场景分析。文章还深入讨论了HS1101湿敏电阻在电路设计中的要点和信号处理方法，提供了实践案例来展示其在智能湿度调节器和农业自动灌溉系统中的应用。最后，本文给出了湿敏电阻的维护保养技巧和故障排除方法，以帮助用户确保湿敏电阻的最佳性能和使用寿命。 # 关键字湿敏电阻；HS1101；特性参数；电路设计；信号处理；环境监测；故障排除参考资

MATLAB在一个图形窗口中创建一行两列的子图的代码

在MATLAB中，可以使用`subplot`函数在一个图形窗口中创建多个子图。对于一行两列的子图，可以使用以下代码： ```matlab % 创建第一个子图 subplot(1, 2, 1); plot([1, 2, 3], [4, 5, 6]); title('子图1'); % 创建第二个子图 subplot(1, 2, 2); plot([1, 2, 3], [6, 5, 4]); title('子图2'); ``` 这段代码的详细解释如下： 1. `subplot(1, 2, 1);`：创建一个1行2列的子图布局，并激活第一个子图。 2. `plot([1, 2, 3], [4,

Doks Hugo主题：打造安全快速的现代文档网站

资源摘要信息:"Doks是一个适用于Hugo的现代文档主题，旨在帮助用户构建安全、快速且对搜索引擎优化友好的文档网站。在短短1分钟内即可启动一个具有Doks特色的演示网站。以下是选择Doks的九个理由： 1. 安全意识：Doks默认提供高安全性的设置，支持在上线时获得A+的安全评分。用户还可以根据自己的需求轻松更改默认的安全标题。 2. 默认快速：Doks致力于打造速度，通过删除未使用的CSS，实施预取链接和图像延迟加载技术，在上线时自动达到100分的速度评价。这些优化有助于提升网站加载速度，提供更佳的用户体验。 3. SEO就绪：Doks内置了对结构化数据、开放图谱和Twitter卡的智能默认设置，以帮助网站更好地被搜索引擎发现和索引。用户也能根据自己的喜好对SEO设置进行调整。 4. 开发工具：Doks为开发人员提供了丰富的工具，包括代码检查功能，以确保样式、脚本和标记无错误。同时，还支持自动或手动修复常见问题，保障代码质量。 5. 引导框架：Doks利用Bootstrap框架来构建网站，使得网站不仅健壮、灵活而且直观易用。当然，如果用户有其他前端框架的需求，也可以轻松替换使用。 6. Netlify就绪：Doks为部署到Netlify提供了合理的默认配置。用户可以利用Netlify平台的便利性，轻松部署和维护自己的网站。 7. SCSS支持：在文档主题中提及了SCSS，这表明Doks支持使用SCSS作为样式表预处理器，允许更高级的CSS样式化和模块化设计。 8. 多语言支持：虽然没有在描述中明确提及，但Doks作为Hugo主题，通常具备多语言支持功能，这为构建国际化文档网站提供了便利。 9. 定制性和可扩展性：Doks通过其设计和功能的灵活性，允许用户根据自己的品牌和项目需求进行定制。这包括主题颜色、布局选项以及组件的添加或修改。文件名称 'docs-main' 可能是Doks主题的核心文件，包含网站的主要内容和配置。这个文件对于设置和维护文档网站来说是至关重要的，因为它包含了网站的主要配置信息，如导航结构、品牌设置、SEO配置等。开发者在使用Doks主题时，将重点调整和优化这个文件以满足具体的项目需求。"

E9流程表单前端接口API(V5)：前端与后端协同开发的黄金法则

![E9流程表单前端接口API(V5)：前端与后端协同开发的黄金法则](https://opengraph.githubassets.com/4b7b246f81a756c8056ca0f80a5b46fad74e128b86dec7d59f1aeedb4b99c6a7/sotiriosmoustogiannis/process-json-format) # 摘要本文全面介绍了E9流程表单API(V5)的开发与应用，阐述了协同开发理论基础和前端实践，并结合案例分析展示了API在企业流程自动化中的实战应用。文章首先概述了E9流程表单API(V5)的核心概念，然后详细探讨了前后端协同开发的重要

python 一个程序,读出“三国演义.txt”文件中的三国演义全文,将常见人名进行去重后生成词云,并列出词频最高的10-20个词,并形成词云(可以有不同的形状)。

相关推荐

基于Python实现的词云生成代码，从txt文件中读取词语，生成指定图片的词云图

统计词频和生成词云python程序

词云生成，Python

python代码 设计一个程序,读出“三国演义.txt”文件中的三国演义全文,将常见人名进行去重后生成词云,并列出词频最高的10-20个词,并形成词云比如人物头像，三国地图

用Python设计一个程序，读出“三国演义.txt”文件中的三国演义全文，将常见人名进行去重后生成词云，并列出词频最高的10-20个词，并形成词云（可以有不同的形状）。

python三国演义人名词云。 设计一个程序，读出“三国演义.txt”文件中的三国演义全文，将常见人名进行去重后生成词云，并列出词频最高的10-20个词，并形成词云（可以有不同的形状）。

设计一个程序，读出“三国演义.txt”文件中的三国演义全文，将常见人名进行去重后生成词云，并列出词频最高的10-20个词，并形成词云（可以有不同的形状）。

三国演义人名词云: 设计一个程序,读出“三国演义.txt”文件中的三国演义全文,将常见人名进行去重后生成词云,并列出词频最高的10-20个词,并形成词云(可以有不同的形状)。

python——三国演义词云.zip

【Python】三国演义词频统计，wordcloud实现

python词云进阶——三国版

豆瓣短评的爬虫程序，并经过数据预处理和JieBa分词，统计词频，最终生成次云.zip

Vim pythonmode PyLint绳Pydoc断点从框.zip

springboot138宠物领养系统的设计与实现.zip

关键词：冷热电联供；CHP机组；热泵；冰储冷空调；需求响应 参考文献：《基于综合需求响应和奖惩阶梯型碳交易的综合能源系统优化调度》《计及需求响应和阶梯型碳交易机制的区域综合能源系统优化运行》碳交易机

包含300个可选插件rails git macOS hub docker homebrew node php pyth.zip

springboot148江理工文档管理系统的设计与实现.zip

大家在看

ISO 16845-1-Part 1-Data link layer and physical signalling-2016

RealityCapture中文教程

C/C++标准库函数速查手册

libomp140.x86-64.dll

Python tkinter模块弹出窗口及传值回到主窗口操作详解

最新推荐

Vim pythonmode PyLint绳Pydoc断点从框.zip

springboot138宠物领养系统的设计与实现.zip

关键词：冷热电联供；CHP机组；热泵；冰储冷空调；需求响应 参考文献：《基于综合需求响应和奖惩阶梯型碳交易的综合能源系统优化调度》《计及需求响应和阶梯型碳交易机制的区域综合能源系统优化运行》碳交易机

包含300个可选插件rails git macOS hub docker homebrew node php pyth.zip

springboot148江理工文档管理系统的设计与实现.zip

Terraform AWS ACM 59版本测试与实践

【HS1101湿敏电阻全面解析】：从基础知识到深度应用的完整指南

MATLAB在一个图形窗口中创建一行两列的子图的代码

Doks Hugo主题：打造安全快速的现代文档网站

E9流程表单前端接口API(V5)：前端与后端协同开发的黄金法则

python代码设计一个程序,读出“三国演义.txt”文件中的三国演义全文,将常见人名进行去重后生成词云,并列出词频最高的10-20个词,并形成词云比如人物头像，三国地图

python三国演义人名词云。设计一个程序，读出“三国演义.txt”文件中的三国演义全文，将常见人名进行去重后生成词云，并列出词频最高的10-20个词，并形成词云（可以有不同的形状）。

关键词：冷热电联供；CHP机组；热泵；冰储冷空调；需求响应参考文献：《基于综合需求响应和奖惩阶梯型碳交易的综合能源系统优化调度》《计及需求响应和阶梯型碳交易机制的区域综合能源系统优化运行》碳交易机

关键词：冷热电联供；CHP机组；热泵；冰储冷空调；需求响应参考文献：《基于综合需求响应和奖惩阶梯型碳交易的综合能源系统优化调度》《计及需求响应和阶梯型碳交易机制的区域综合能源系统优化运行》碳交易机