从标准输入中读入一个英文单词及查找方式,在一个给定的英文常用单词字典文件dictionary3000.txt中查找该单词,返回查找结果(查找到返回1,否则返回0)和查找过程中单词的比较次数。查找前,先将所有字典中单词读入至一个单词表(数组)中,然后按要求进行查找。字典中单词总数不超过3500,单词中的字符都是英文小写字母,并已按字典序排好序(可从课件下载区下载该字典文件)。字典中的单词和待查找单词的字符个数不超过20。 查找方式说明:查找方式以1~4数字表示,每个数字含义如下: 1:在单词表中以顺序查找方式查找,因为单词表已排好序,遇到相同的或第一个比待查找的单词大的单词,就要终止查找; 2:在单词表中以折半查找方式查找; 3:在单词表中通过索引表来获取单词查找范围,并在该查找范围中以折半方式查找。索引表构建方式为:以26个英文字母为头字母的单词在字典中的起始位置和单词个数来构建索引表,如: 字母 起始位置 单词个数 a 0 248 b 248 167 … … … 该索引表表明以字母a开头的单词在单词表中的开始下标位置为0,单词个数为248。 4:按下面给定的hash函数为字典中单词构造一个hash表,hash冲突时按字典序依次存放单词。hash查找遇到冲突时,采用链地址法处理,在冲突链表中找到或未找到(遇到第一个比待查找的单词大的单词或链表结束)便结束查找。用c语言写出方法四的代码

时间: 2023-07-14 15:11:42 浏览: 216
PDF

Python统计纯文本文件中英文单词出现个数的方法总结【测试可用】

以下是方法四的代码,包括构造哈希表和哈希查找函数: ```c #include <stdio.h> #include <stdlib.h> #include <string.h> #define MAX_WORD_LEN 20 // 最大单词长度 #define TABLE_SIZE 4000 // 哈希表大小 // 哈希表节点结构体 typedef struct HashNode { char word[MAX_WORD_LEN+1]; // 单词 int index; // 在单词表中的下标 struct HashNode *next; // 冲突链表 } HashNode; // 构造哈希表 void build_hash_table(char **word_list, int word_count, HashNode **hash_table) { for (int i = 0; i < word_count; i++) { HashNode *node = (HashNode *)malloc(sizeof(HashNode)); strncpy(node->word, word_list[i], MAX_WORD_LEN); node->index = i; node->next = NULL; // 计算哈希值 int hash_value = 0; for (int j = 0; j < strlen(word_list[i]); j++) { hash_value = (hash_value * 26 + (word_list[i][j] - 'a')) % TABLE_SIZE; } // 处理冲突 if (hash_table[hash_value] == NULL) { hash_table[hash_value] = node; } else { HashNode *cur = hash_table[hash_value]; while (cur->next != NULL) { cur = cur->next; } cur->next = node; } } } // 哈希查找函数 int hash_search(char *word, HashNode **hash_table, int *compare_count) { // 计算哈希值 int hash_value = 0; for (int i = 0; i < strlen(word); i++) { hash_value = (hash_value * 26 + (word[i] - 'a')) % TABLE_SIZE; } // 在冲突链表中查找 HashNode *cur = hash_table[hash_value]; while (cur != NULL) { (*compare_count)++; if (strcmp(cur->word, word) == 0) { return 1; } else if (strcmp(cur->word, word) > 0) { return 0; } cur = cur->next; } return 0; } int main() { char **word_list = (char **)malloc(sizeof(char *) * 3500); for (int i = 0; i < 3500; i++) { word_list[i] = (char *)malloc(sizeof(char) * (MAX_WORD_LEN + 1)); } // 读入单词表 FILE *fp = fopen("dictionary3000.txt", "r"); int word_count = 0; while (fscanf(fp, "%s", word_list[word_count]) != EOF) { word_count++; } fclose(fp); // 构造哈希表 HashNode **hash_table = (HashNode **)malloc(sizeof(HashNode *) * TABLE_SIZE); for (int i = 0; i < TABLE_SIZE; i++) { hash_table[i] = NULL; } build_hash_table(word_list, word_count, hash_table); // 读入待查找单词和查找方式 char word[MAX_WORD_LEN+1]; int method; scanf("%s%d", word, &method); // 查找单词并输出结果和比较次数 int compare_count = 0; int found = 0; switch (method) { case 1: for (int i = 0; i < word_count; i++) { compare_count++; if (strcmp(word_list[i], word) == 0) { found = 1; break; } else if (strcmp(word_list[i], word) > 0) { break; } } break; case 2: { int left = 0, right = word_count - 1; while (left <= right) { compare_count++; int mid = (left + right) / 2; if (strcmp(word_list[mid], word) == 0) { found = 1; break; } else if (strcmp(word_list[mid], word) > 0) { right = mid - 1; } else { left = mid + 1; } } break; } case 3: { int index_table[26][2]; // 索引表 for (int i = 0; i < 26; i++) { int j = 0; while (j < word_count && word_list[j][0] - 'a' < i) { j++; } index_table[i][0] = j; while (j < word_count && word_list[j][0] - 'a' == i) { j++; } index_table[i][1] = j - index_table[i][0]; } int start = index_table[word[0]-'a'][0], end = start + index_table[word[0]-'a'][1] - 1; int left = start, right = end; while (left <= right) { compare_count++; int mid = (left + right) / 2; if (strcmp(word_list[mid], word) == 0) { found = 1; break; } else if (strcmp(word_list[mid], word) > 0) { right = mid - 1; } else { left = mid + 1; } } break; } case 4: found = hash_search(word, hash_table, &compare_count); break; default: printf("Invalid method\n"); return 1; } // 输出结果和比较次数 if (found) { printf("1\n"); } else { printf("0\n"); } printf("%d\n", compare_count); // 释放内存 for (int i = 0; i < 3500; i++) { free(word_list[i]); } free(word_list); for (int i = 0; i < TABLE_SIZE; i++) { HashNode *cur = hash_table[i]; while (cur != NULL) { HashNode *tmp = cur->next; free(cur); cur = tmp; } } free(hash_table); return 0; } ```
阅读全文

相关推荐

用python实现: 【问题描述】 编写程序,打开一篇英文文章(存在当前目录下的文件in.txt中),为该文章生成词汇表(存到当前目录下的另一个文件words.txt中)。文章中单词指的是只由小写或大写字母组成的字符串,但词汇表中的单词都是以小写字母的形式出现,若文章中出现多个大小写无关的相同单词,只在词汇表中生成一个单词。假设生成的词汇表中单词个数不会超过100个,且每个单词的长度不会超过20。词汇表中的单词以字典顺序由小到大存放。 【输入形式】 输入的英文文章存储在当前目录下的文件in.txt中。 【输出形式】 输出的词汇表存储到当前目录下的文件words.txt中,每个单词独占一行,以字典顺序由小到大存放。 【输入样例】 假如in.txt中的文章内容如下: C was originally designed for and implemented on the UNIX operating system on the DEC PDP-11, by Dennis Ritchie. The book is not an introductory programming manual. 【输出样例】 生成的词汇表存储在words.txt中,其内容应如下所示: an and book by c dec dennis designed for implemented introductory is manual not on operating originally pdp programming ritchie system the unix was 【样例说明】 读入的英文文章中,所有的英文字母串(由一个或多个连续字母组成)都将对应生成词汇表中的一个单词,例如:文章中的两个the和一个The对应生成词汇表中单词the;单个字母C也作为单个单词出现,所以也对应生成词汇表中的一个单词c。

最新推荐

recommend-type

Python实现统计英文单词个数及字符串分割代码

在Python编程语言中,统计英文单词个数和字符串分割是常见的文本处理任务。这里我们将详细探讨这两种操作的实现方法。 首先,让我们来看一下如何进行字符串分割。在Python中,`str.split()` 方法是用于将字符串分割...
recommend-type

python将每个单词按空格分开并保存到文件中

然后,对于列表中的每一个单词(`db`),如果它不在目标文件(`outfile`)中,就将其写入目标文件,每行一个单词。这里通过`not in`操作符判断单词是否已存在于目标文件,注意这个判断在实际应用中可能不够准确,...
recommend-type

C语言从txt文件中逐行读入数据存到数组中的实现方法

这就是在C语言中从`.txt`文件中逐行读取数据并存入数组的基本步骤。通过这种方式,你可以灵活地处理各种格式的文本数据文件,无论数据是整型还是浮点型,一维还是多维。在实际项目中,你可能需要根据具体需求进行...
recommend-type

C++中进行txt文件读入和写入的方法示例

C++中进行txt文件读入和写入的方法示例 本文主要介绍了C++中进行txt文件读入和写入的相关知识点,通过示例代码详细地介绍了读取txt文件和写入txt文件的方法。以下是从文章中提取的知识点: 1. ifstream和ofstream...
recommend-type

C++从文本文件读取数据到vector中的方法

接下来,我们定义一个名为`InputData_To_Vector`的函数,该函数负责从文本文件中读取数据并填充`std::vector&lt;int&gt;`: ```cpp vector&lt;int&gt; *InputData_To_Vector(){ vector&lt;int&gt; *p = new vector; // 创建一个新的...
recommend-type

黑板风格计算机毕业答辩PPT模板下载

资源摘要信息:"创意经典黑板风格毕业答辩论文课题报告动态ppt模板" 在当前数字化教学与展示需求日益增长的背景下,PPT模板成为了表达和呈现学术成果及教学内容的重要工具。特别针对计算机专业的学生而言,毕业设计的答辩PPT不仅仅是一个展示的平台,更是其设计能力、逻辑思维和审美观的综合体现。因此,一个恰当且创意十足的PPT模板显得尤为重要。 本资源名为“创意经典黑板风格毕业答辩论文课题报告动态ppt模板”,这表明该模板具有以下特点: 1. **创意设计**:模板采用了“黑板风格”的设计元素,这种风格通常模拟传统的黑板书写效果,能够营造一种亲近、随性的学术氛围。该风格的模板能够帮助展示者更容易地吸引观众的注意力,并引发共鸣。 2. **适应性强**:标题表明这是一个毕业答辩用的模板,它适用于计算机专业及其他相关专业的学生用于毕业设计课题的汇报。模板中设计的版式和内容布局应该是灵活多变的,以适应不同课题的展示需求。 3. **动态效果**:动态效果能够使演示内容更富吸引力,模板可能包含了多种动态过渡效果、动画效果等,使得展示过程生动且充满趣味性,有助于突出重点并维持观众的兴趣。 4. **专业性质**:由于是毕业设计用的模板,因此该模板在设计时应充分考虑了计算机专业的特点,可能包括相关的图表、代码展示、流程图、数据可视化等元素,以帮助学生更好地展示其研究成果和技术细节。 5. **易于编辑**:一个良好的模板应具备易于编辑的特性,这样使用者才能根据自己的需要进行调整,比如替换文本、修改颜色主题、更改图片和图表等,以确保最终展示的个性和专业性。 结合以上特点,模板的使用场景可以包括但不限于以下几种: - 计算机科学与技术专业的学生毕业设计汇报。 - 计算机工程与应用专业的学生论文展示。 - 软件工程或信息技术专业的学生课题研究成果展示。 - 任何需要进行学术成果汇报的场合,比如研讨会议、学术交流会等。 对于计算机专业的学生来说,毕业设计不仅仅是完成一个课题,更重要的是通过这个过程学会如何系统地整理和表述自己的思想。因此,一份好的PPT模板能够帮助他们更好地完成这个任务,同时也能够展现出他们的专业素养和对细节的关注。 此外,考虑到模板是一个压缩文件包(.zip格式),用户在使用前需要解压缩,解压缩后得到的文件为“创意经典黑板风格毕业答辩论文课题报告动态ppt模板.pptx”,这是一个可以直接在PowerPoint软件中打开和编辑的演示文稿文件。用户可以根据自己的具体需要,在模板的基础上进行修改和补充,以制作出一个具有个性化特色的毕业设计答辩PPT。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

提升点阵式液晶显示屏效率技术

![点阵式液晶显示屏显示程序设计](https://iot-book.github.io/23_%E5%8F%AF%E8%A7%81%E5%85%89%E6%84%9F%E7%9F%A5/S3_%E8%A2%AB%E5%8A%A8%E5%BC%8F/fig/%E8%A2%AB%E5%8A%A8%E6%A0%87%E7%AD%BE.png) # 1. 点阵式液晶显示屏基础与效率挑战 在现代信息技术的浪潮中,点阵式液晶显示屏作为核心显示技术之一,已被广泛应用于从智能手机到工业控制等多个领域。本章节将介绍点阵式液晶显示屏的基础知识,并探讨其在提升显示效率过程中面临的挑战。 ## 1.1 点阵式显
recommend-type

在SoC芯片的射频测试中,ATE设备通常如何执行系统级测试以保证芯片量产的质量和性能一致?

SoC芯片的射频测试是确保无线通信设备性能的关键环节。为了在量产阶段保证芯片的质量和性能一致性,ATE(Automatic Test Equipment)设备通常会执行一系列系统级测试。这些测试不仅关注芯片的电气参数,还包含电磁兼容性和射频信号的完整性检验。在ATE测试中,会根据芯片设计的规格要求,编写定制化的测试脚本,这些脚本能够模拟真实的无线通信环境,检验芯片的射频部分是否能够准确处理信号。系统级测试涉及对芯片基带算法的验证,确保其能够有效执行无线信号的调制解调。测试过程中,ATE设备会自动采集数据并分析结果,对于不符合标准的芯片,系统能够自动标记或剔除,从而提高测试效率和减少故障率。为了
recommend-type

CodeSandbox实现ListView快速创建指南

资源摘要信息:"listview:用CodeSandbox创建" 知识点一:CodeSandbox介绍 CodeSandbox是一个在线代码编辑器,专门为网页应用和组件的快速开发而设计。它允许用户即时预览代码更改的效果,并支持多种前端开发技术栈,如React、Vue、Angular等。CodeSandbox的特点是易于使用,支持团队协作,以及能够直接在浏览器中编写代码,无需安装任何软件。因此,它非常适合初学者和快速原型开发。 知识点二:ListView组件 ListView是一种常用的用户界面组件,主要用于以列表形式展示一系列的信息项。在前端开发中,ListView经常用于展示从数据库或API获取的数据。其核心作用是提供清晰的、结构化的信息展示方式,以便用户可以方便地浏览和查找相关信息。 知识点三:用JavaScript创建ListView 在JavaScript中创建ListView通常涉及以下几个步骤: 1. 创建HTML的ul元素作为列表容器。 2. 使用JavaScript的DOM操作方法(如document.createElement, appendChild等)动态创建列表项(li元素)。 3. 将创建的列表项添加到ul容器中。 4. 通过CSS来设置列表和列表项的样式,使其符合设计要求。 5. (可选)为ListView添加交互功能,如点击事件处理,以实现更丰富的用户体验。 知识点四:在CodeSandbox中创建ListView 在CodeSandbox中创建ListView可以简化开发流程,因为它提供了一个在线环境来编写代码,并且支持实时预览。以下是使用CodeSandbox创建ListView的简要步骤: 1. 打开CodeSandbox官网,创建一个新的项目。 2. 在项目中创建或编辑HTML文件,添加用于展示ListView的ul元素。 3. 创建或编辑JavaScript文件,编写代码动态生成列表项,并将它们添加到ul容器中。 4. 使用CodeSandbox提供的实时预览功能,即时查看ListView的效果。 5. 若有需要,继续编辑或添加样式文件(通常是CSS),对ListView进行美化。 6. 利用CodeSandbox的版本控制功能,保存工作进度和团队协作。 知识点五:实践案例分析——listview-main 文件名"listview-main"暗示这可能是一个展示如何使用CodeSandbox创建基本ListView的项目。在这个项目中,开发者可能会包含以下内容: 1. 使用React框架创建ListView的示例代码,因为React是目前较为流行的前端库。 2. 展示如何将从API获取的数据渲染到ListView中,包括数据的获取、处理和展示。 3. 提供基本的样式设置,展示如何使用CSS来美化ListView。 4. 介绍如何在CodeSandbox中组织项目结构,例如如何分离组件、样式和脚本文件。 5. 包含一个简单的用户交互示例,例如点击列表项时弹出详细信息等。 总结来说,通过标题“listview:用CodeSandbox创建”,我们了解到本资源是一个关于如何利用CodeSandbox这个在线开发环境,来快速实现一个基于JavaScript的ListView组件的教程或示例项目。通过上述知识点的梳理,可以加深对如何创建ListView组件、CodeSandbox平台的使用方法以及如何在该平台中实现具体功能的理解。