打开一个文本,写一个词频统计,按照倒序排的python代码

时间: 2024-02-26 21:56:28 浏览: 20
好的,以下是Python的词频统计,按照倒序排列的代码: ```python from collections import Counter # 打开文本文件 with open("text.txt", "r") as file: # 读取文件内容 text = file.read() # 去除标点符号和换行符 text = text.lower().replace("\n", " ").translate(str.maketrans("", "", string.punctuation)) # 分离单词 words = text.split() # 统计单词频率 word_freq = Counter(words) # 按照倒序排列 sorted_word_freq = sorted(word_freq.items(), key=lambda x: x[1], reverse=True) # 输出结果 for word, freq in sorted_word_freq: print(word, freq) ``` 这段代码会读取一个名为 `text.txt` 的文本文件,统计其中所有单词的出现频率,并按照倒序排列输出结果。请注意,这段代码没有使用任何外部库,只使用了 Python 内置的 `collections` 库。
相关问题

写一个哈姆雷特词频统计python代码

以下是一个简单的哈姆雷特词频统计 Python 代码示例: ``` import string # 打开文本文件并读取内容 with open('hamlet.txt', 'r') as file: text = file.read() # 将文本转换为小写并去除标点符号 text = text.lower().translate(str.maketrans('', '', string.punctuation)) # 将文本拆分为单词列表 words = text.split() # 创建一个空字典来存储单词计数 word_count = {} # 遍历单词列表并计数每个单词出现的次数 for word in words: if word in word_count: word_count[word] += 1 else: word_count[word] = 1 # 按单词出现次数从高到低排序并打印结果 for word, count in sorted(word_count.items(), key=lambda x: x[1], reverse=True): print(f'{word}: {count}') ``` 在这个示例代码中,我们首先使用 Python 的 `with` 语句打开并读取了一个名为 `hamlet.txt` 的文本文件。然后,我们将文本转换为小写并去除标点符号,这样可以使单词的计数更加准确。接着,我们使用 `split()` 方法将文本拆分为单词列表,并创建一个空字典来存储单词计数。最后,我们遍历单词列表并对每个单词计数,最终按单词出现次数从高到低排序并打印结果。

写一个哈姆雷特词频统计Python代码

以下是一个简单的Python代码,用于对哈姆雷特文本进行词频统计: ```python import string # 打开文本文件并读取内容 with open('hamlet.txt', 'r') as file: text = file.read() # 将文本转换为小写并删除标点符号 text = text.lower() text = text.translate(str.maketrans('', '', string.punctuation)) # 将文本拆分为单个单词 words = text.split() # 创建一个空字典来存储每个单词的出现次数 word_counts = {} # 计算每个单词的出现次数并将其存储在字典中 for word in words: if word not in word_counts: word_counts[word] = 1 else: word_counts[word] += 1 # 按出现次数从高到低对单词进行排序 sorted_words = sorted(word_counts.items(), key=lambda x: x[1], reverse=True) # 输出前10个单词及其出现次数 for word, count in sorted_words[:10]: print(word, count) ``` 请注意,此代码假定文本文件名为`hamlet.txt`。您需要将文件名替换为您自己的文本文件名。此外,此代码仅考虑单个单词,因此可能无法正确处理某些单词形式(例如名词的复数形式或动词的时态形式)。

相关推荐

最新推荐

recommend-type

python分割一个文本为多个文本的方法

主要为大家详细介绍了python分割一个文本为多个文本,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
recommend-type

Python 合并多个TXT文件并统计词频的实现

主要介绍了Python 合并多个TXT文件并统计词频的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
recommend-type

Python实现保证只能运行一个脚本实例

主要介绍了Python实现保证只能运行一个脚本实例,本文直接给出实现代码,需要的朋友可以参考下
recommend-type

Python实现统计英文单词个数及字符串分割代码

主要介绍了Python实现统计英文单词个数及字符串分割方法,本文分别给出代码实例,需要的朋友可以参考下
recommend-type

python字符串替换第一个字符串的方法

主要介绍了python字符串替换第一个字符串的方法,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

解释minorization-maximization (MM) algorithm,并给出matlab代码编写的例子

Minorization-maximization (MM) algorithm是一种常用的优化算法,用于求解非凸问题或含有约束的优化问题。该算法的基本思想是通过构造一个凸下界函数来逼近原问题,然后通过求解凸下界函数的最优解来逼近原问题的最优解。具体步骤如下: 1. 初始化参数 $\theta_0$,设 $k=0$; 2. 构造一个凸下界函数 $Q(\theta|\theta_k)$,使其满足 $Q(\theta_k|\theta_k)=f(\theta_k)$; 3. 求解 $Q(\theta|\theta_k)$ 的最优值 $\theta_{k+1}=\arg\min_\theta Q(
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。