首页完成一个python hamlet词频统计程序并增加一个单词黑名单列表定义，在列表中的单词不在统计

完成一个python hamlet词频统计程序并增加一个单词黑名单列表定义，在列表中的单词不在统计

时间: 2024-02-01 16:15:03 浏览: 75

hamlet单词统计代码

5星 · 资源好评率100%

Python,莎士比亚hamlet使用频率最高的单词统计代码，适用于英文文件的使用单词统计

以下是一个简单的 Python 代码，用于对哈姆雷特文本进行词频统计。同时，我们增加了一个单词黑名单列表，如果单词出现在该列表中，则不进行统计。 ```python # -*- coding: utf-8 -*- from collections import Counter blacklist = ["the", "and", "of", "to"] # 单词黑名单列表 with open("hamlet.txt", "r") as f: text = f.read().lower() # 将文本中的标点符号和换行符替换为空格 text = text.replace('\n', ' ').replace(',', ' ').replace('.', ' ').replace(';', ' ').replace(':', ' ').replace('!', ' ').replace('?', ' ') # 将文本分割成单词列表 words = text.split() # 过滤掉黑名单中的单词 filtered_words = [word for word in words if word not in blacklist] # 统计单词频率 word_counts = Counter(filtered_words) # 输出前20个出现频率最高的单词 for word, count in word_counts.most_common(20): print(f"{word}: {count}") ``` 在上面的代码中，我们首先定义了一个单词黑名单列表 `blacklist`，其中包含不希望被统计的单词。然后，我们打开并读取哈姆雷特文本文件 `hamlet.txt`，将其转换为小写，并将文本中的标点符号和换行符替换为空格。接下来，我们将文本分割成单词列表，在这之前我们先过滤掉黑名单中的单词。最后，我们使用 `collections.Counter` 对单词列表进行统计，并输出出现频率最高的前20个单词及其出现次数。

阅读全文

最新推荐

Python 合并多个TXT文件并统计词频的实现

完成一个python hamlet词频统计程序并增加一个单词黑名单列表定义，在列表中的单词不在统计

相关推荐

python学习文本词频统计hamlet三国演义

Python 合并多个TXT文件并统计词频的实现

Python之词频统计

python文本词频统计hamlet

用Python实现hamlet的词频统计

Hamlet英文词频统计 python代码

hamlet词频统计基本版及改进版两个程序

文本词频统计，Hamlet英文词频统计以及《三国演义》人物出场统计python

python统计hamlet.txt中英文单词使用频率最高的前十个单词并排序写入到sort.txt中，需排除原文大小写，单词间的间隔多样性的差异对词频统计的干扰

文本词频统计，Hamlet英文词频统计以及《三国演义》人物出场统计。python

文本词频统计,Hamlet英文词频统计以及《三国演义》人物出场统计。python

python，Hamlet英文词频统计以及《三国演义》人物出场统计。

4.文本词频统计，Hamlet 英文词频统计以及《三国演义》人物出场统计。python

Python哈姆雷特词频统计

编写程序：进行Hamlet英文词频统计并打印出来

Hamlet英文词频统计

hamlet英文词频统计

编写程序：进行Hamlet英文词频统计

python第三方库jieba安装 :cmd命令行,编写程序实现:Hamlet英文词频统计

最新推荐

Python 合并多个TXT文件并统计词频的实现

MOOC《Python语言程序设计》第6周练习题

Android圆角进度条控件的设计与应用

管理建模和仿真的文件

【R语言lattice包实战】：从案例到技巧，图形制作不再难

输入正整数n.打出长度为n的菱形

mui框架实现带侧边栏的响应式布局

"互动学习：行动中的多样性与论文攻读经历"

【交互式图形】：Shiny应用中lattice包的巧妙应用指南

安装包部署到docker中