请用c语言写一个用哈希表进行文件中单词的词频统计的代码，不区分大小写，把大写都转换为小写，文件当中有空格或者其他非字母符号，最后输出出现次数最高的n个单词，如果次数相同按照字典序输出

好的，以下是我为您编写的代码： ```c #include <stdio.h> #include <ctype.h> #include <string.h> #include <stdlib.h> #define MAX_WORD_LEN 100 // 最长单词长度 #define MAX_N 100 // 最多输出前n个单词 #define TABLE_SIZE 10007 // 哈希表大小，选用一个质数 typedef struct WordNode { char word[MAX_WORD_LEN]; int count; struct WordNode* next; } WordNode; // 哈希函数，将字符串映射到哈希表中的位置 int hash(char* str) { int hashval = 0; while (*str != '\0') { hashval = 31 * hashval + *str; str++; } return hashval % TABLE_SIZE; } // 新建一个单词节点 WordNode* new_word_node(char* str) { WordNode* node = (WordNode*)malloc(sizeof(WordNode)); strcpy(node->word, str); node->count = 1; node->next = NULL; return node; } // 释放所有单词节点的空间 void free_word_list(WordNode* head) { while (head != NULL) { WordNode* temp = head->next; free(head); head = temp; } } // 向哈希表中添加一个单词节点 void add_word_node(WordNode** table, char* str) { int index = hash(str); if (table[index] == NULL) { table[index] = new_word_node(str); } else { WordNode* node = table[index]; while (node != NULL) { if (strcmp(node->word, str) == 0) { node->count++; return; } node = node->next; } node = new_word_node(str); node->next = table[index]; table[index] = node; } } // 读取文件并统计单词出现次数 void count_words(FILE* fp, WordNode** table) { char word[MAX_WORD_LEN]; while (fscanf(fp, "%s", word) != EOF) { // 将单词转换成小写 int len = strlen(word); for (int i = 0; i < len; i++) { word[i] = tolower(word[i]); } // 去除单词末尾的非字母符号 int i = len - 1; while (i >= 0 && !isalpha(word[i])) { i--; } word[i + 1] = '\0'; // 添加单词节点到哈希表中 if (strlen(word) > 0) { add_word_node(table, word); } } } // 按照单词出现次数从大到小排序，次数相同按照字典序从小到大排序 void sort_words(WordNode** table, WordNode** sorted, int* n) { WordNode* nodes[TABLE_SIZE]; int count = 0; // 将哈希表中的单词节点放入数组中 for (int i = 0; i < TABLE_SIZE; i++) { WordNode* node = table[i]; while (node != NULL) { nodes[count++] = node; node = node->next; } } // 冒泡排序 for (int i = 0; i < count - 1; i++) { for (int j = 0; j < count - i - 1; j++) { if (nodes[j]->count < nodes[j + 1]->count || (nodes[j]->count == nodes[j + 1]->count && strcmp(nodes[j]->word, nodes[j + 1]->word) > 0)) { WordNode* temp = nodes[j]; nodes[j] = nodes[j + 1]; nodes[j + 1] = temp; } } } // 将排序后的单词节点放入sorted数组中，并更新n int max_n = *n; for (int i = 0; i < count && max_n > 0; i++) { if (nodes[i]->count == 0) { break; } sorted[*n - max_n] = nodes[i]; max_n--; } *n = *n - max_n; } int main() { char filename[MAX_WORD_LEN]; printf("请输入文件名："); scanf("%s", filename); FILE* fp = fopen(filename, "r"); if (fp == NULL) { printf("文件打开失败！\n"); return 0; } WordNode* table[TABLE_SIZE] = { NULL }; count_words(fp, table); fclose(fp); printf("请输入要输出的单词个数："); int n; scanf("%d", &n); WordNode* sorted[MAX_N]; for (int i = 0; i < n; i++) { sorted[i] = NULL; } sort_words(table, sorted, &n); printf("出现次数最多的%d个单词：\n", n); for (int i = 0; i < n && sorted[i] != NULL; i++) { printf("%s: %d\n", sorted[i]->word, sorted[i]->count); } // 释放所有单词节点的空间 for (int i = 0; i < TABLE_SIZE; i++) { free_word_list(table[i]); } return 0; } ``` 该代码使用了哈希表来统计文件中单词的词频，不区分大小写，将大写字母都转换为小写。程序先读取文件中的单词，然后通过哈希函数将单词映射到哈希表中的位置，如果该位置为空则新建一个单词节点，否则在该位置的单词链表中查找是否已经有该单词的节点，如果有则将节点的出现次数加1，否则新建一个单词节点并添加到单词链表的头部。最后，程序将哈希表中所有单词节点放入一个数组中，然后进行排序，排序时先按照单词出现次数从大到小排序，如果次数相同则按照字典序从小到大排序。最后，程序输出出现次数最多的前n个单词及其出现次数。程序的时间复杂度为O(nlogn)，其中n为单词的个数。

阅读全文

请用c语言写一个用哈希表进行文件中单词的词频统计的代码，不区分大小写，把大写都转换为小写，文件当中有空格或者其他非字母符号，最后输出出现次数最高的n个单词，如果次数相同按照字典序输出

相关推荐

哈希表实现单词频率统计与文本排序

基于哈希表实现英文文本的词频统计与查找

哈希表实现查找功能的C语言代码

试着统计一下: 包含大小写英文的字符串文件中的字符频率 要求：要将每个字符的大小写频率都要统计到一起 c语言

C语言统计字母使用频率共4页.pdf.zip

单词统计小程序

凯撒密码c语言凯撒密码c语言

c语言经典案例

c++实现LM和NTLM哈希

Java开发技术大全(500个源代码).

C程序范例宝典（基础代码详解）

C语言编程中的命名与除法陷阱

C语言实现字符频度统计与字符串操作实验报告

统计文本单词个数与频率

C语言结构体与文件操作：持久化存储的实现方法

C语言中的字符串处理函数及技巧

C语言基本词法和编码规范

C语言实践技巧：字符串处理与常用函数介绍

C语言计算数组中每个字符出现的次数

C语言词频统计程序设计与实现

最新推荐

C语言基于哈希表实现通讯录

Python 合并多个TXT文件并统计词频的实现

《CSS样式表行为手册》中文chm最新版本

火炬连体网络在MNIST的2D嵌入实现示例

管理建模和仿真的文件

L2正则化的终极指南：从入门到精通，揭秘机器学习中的性能优化技巧

如何构建一个符合GB/T19716和ISO/IEC13335标准的信息安全事件管理框架，并确保业务连续性规划的有效性？

Angular插件增强Application Insights JavaScript SDK功能

"互动学习：行动中的多样性与论文攻读经历"

L1正则化模型诊断指南：如何检查模型假设与识别异常值（诊断流程+案例研究）

试着统计一下: 包含大小写英文的字符串文件中的字符频率要求：要将每个字符的大小写频率都要统计到一起 c语言