根据所给的一段黑神话的文本，构建单词表和出现次数的字典。 3、输出频率最高的10个单词，去除冠词、代词和介词等无意义的单词。 4、可以定义多个函数分别实现独立的功能。在主模块中串联各个函数，实现总体上的功能

要根据给定的文本构建单词表并计算单词出现的频率，我们可以按照以下步骤进行： 1. 预处理文本：首先，我们需要对文本进行预处理，去除标点符号、数字，并将所有单词转换为小写，以便统计时不区分大小写。 2. 分词：将预处理后的文本分割成单词。 3. 构建单词表：创建一个字典来存储单词及其出现的次数。 4. 过滤无意义单词：创建一个列表包含所有需要被过滤的词性，如冠词、代词和介词等。 5. 统计频率：遍历分词后的单词，更新单词表中单词的计数，并过滤掉无意义的单词。 6. 输出前10个频率最高的单词：根据单词表中的计数，选出出现次数最多的10个单词。下面是这个过程的伪代码实现： ```python import string def preprocess_text(text): # 移除标点符号 text = text.translate(str.maketrans('', '', string.punctuation)) # 移除数字 text = ''.join(filter(lambda x: not x.isdigit(), text)) # 转换为小写 text = text.lower() return text def tokenize(text): # 分词，这里简单使用空格分割 return text.split() def build_word_frequency_table(tokens): # 创建单词频率字典 frequency_table = {} # 遍历分词结果 for token in tokens: # 如果单词不在过滤列表中，则计数 if token not in stopwords: frequency_table[token] = frequency_table.get(token, 0) + 1 return frequency_table def get_top_n_frequent_words(frequency_table, n=10): # 根据计数获取前N个最频繁出现的单词 return sorted(frequency_table.items(), key=lambda x: x[1], reverse=True)[:n] # 主模块 def main(): text = "给定的黑神话文本内容" # 预处理文本 preprocessed_text = preprocess_text(text) # 分词 tokens = tokenize(preprocessed_text) # 构建单词频率表 word_frequency_table = build_word_frequency_table(tokens) # 获取前10个最频繁出现的单词 top_10_words = get_top_n_frequent_words(word_frequency_table) # 输出结果 for word, count in top_10_words: print(f"单词: {word}, 出现次数: {count}") # 停用词列表，这里应根据实际情况填充 stopwords = set([ 'the', 'a', 'an', 'and', 'or', 'but', 'is', 'are', 'of', 'to', 'in', 'for', 'on', 'with', 'as', 'by', 'that', 'this', 'it' ]) if __name__ == "__main__": main() ```

阅读全文

根据所给的一段黑神话的文本，构建单词表和出现次数的字典。 3、输出频率最高的10个单词，去除冠词、代词和介词等无意义的单词。 4、可以定义多个函数分别实现独立的功能。在主模块中串联各个函数，实现总体上的功能

相关推荐

Python3实现统计单词表中每个字母出现频率的方法示例

统计指定的文本文件（英文）中，每个单词的出现频率，输出按字典序排列的单词频度表。

Python读取英文文件并记录每个单词出现次数后降序输出示例

编写一个程序，输出该文本文件中含有的单词总数，分析一个文本文件（英文文章）中 各个词出现的频率，输出该文本文件中所有单词的列表，并与出现次数一起打印出来

C++统计文本总单词数并输出各个单词及其出现次数

文件分析(给定一个非中文的文本文件以及一系列查询单词，请输出所查询单词的出现次数。)

统计文本文件中一段英文中某个单词出现的次数及其出现的位置

一个查询文本出现单词次数及位置的代码

Word-Freq:接收一个文本文件并并行输出每个单词的频率

Word-count:输出单词频率、字母频率、单词计数（标记）、单词类型和文本熵的程序

wordFrequencyCalculator:这是我为我的数据结构类编写的程序，它计算文本文件中单词的频率并返回 20 个最常用的单词。 我实现了一个哈希字典来存储文本文件中的单词

统计一篇文档中每个单词出现的次数，频率

利用IOS统计文本中单词出现的次数

Concordance:创建一个指示某些文本中单词出现频率的表格并获取其他数据

将一段以“*”结束的文本中的单词按照字典序打印

python实现统计文本中单词出现的频率详解

1.2（1）总共出现的单词数量 （2）一共有多少个不同的单词 （3）按单词出现的频率从大到小输出单词，每行输出一个单词和数量，每一行格式如下： 单词:数量

免费的防止锁屏小软件，可用于域统一管控下的锁屏机制

大家在看

计算机控制实验74HC4051的使用

软件工程-总体设计概述(ppt-113页).ppt

多文档应用程序MDI-vc++、MFC基础教程

中国移动5G规模试验测试规范--核心网领域--SA基础网元性能测试分册.pdf

CAN分析仪 解析 DBC uds 源码

最新推荐

免费的防止锁屏小软件，可用于域统一管控下的锁屏机制

Python代码实现带装饰的圣诞树控制台输出

白色大气风格的设计师作品模板下载.zip

电商平台开发需求文档.doc

白色简洁风格的办公室室内设计门户网站模板下载.zip

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

编写一个程序，输出该文本文件中含有的单词总数，分析一个文本文件（英文文章）中各个词出现的频率，输出该文本文件中所有单词的列表，并与出现次数一起打印出来

wordFrequencyCalculator:这是我为我的数据结构类编写的程序，它计算文本文件中单词的频率并返回 20 个最常用的单词。我实现了一个哈希字典来存储文本文件中的单词

1.2（1）总共出现的单词数量（2）一共有多少个不同的单词（3）按单词出现的频率从大到小输出单词，每行输出一个单词和数量，每一行格式如下：单词:数量

CAN分析仪解析 DBC uds 源码