使用数组法统计英文文件单词及百分比

5星 · 超过95%的资源 需积分: 50 78 下载量 125 浏览量 更新于2024-09-22 2 收藏 2KB TXT 举报
本篇文章主要介绍了如何使用C语言中的数组方法从英文文本文件(如"english.txt")中读取单词并统计单词出现的次数。以下是详细的步骤和关键知识点: 1. **文件操作**: - 首先,作者导入了`stdio.h`库,这是C语言标准输入输出库,用于文件操作。 - 定义了两个文件指针变量`fp`和`result`,分别用于读取输入文件和写入结果文件。 - 使用`fopen()`函数尝试打开文件,如果文件打开失败,则提示错误并退出程序。 2. **数组定义**: - `char word[1000][20]`是一个二维字符数组,用来存储读取到的单词,最多能容纳1000个单词,每个单词最多20个字符。 - `int count_word[1000]`是一个一维数组,用于记录每个单词出现的次数,长度与`word`数组相同。 3. **单词读取与处理**: - 通过`fgetc()`函数逐个读取文件中的字符。 - 当遇到字母(大写或小写)时,将其转换为小写并存储在`word`数组中,同时`flag`计数器清零。 - 当遇到非字母字符时,`flag`加1,表示单词结束。当`flag`等于1时,统计总单词数,更新当前单词计数,并进行去重处理:遍历`word`数组,如果找到相同的单词,增加对应计数,然后回溯数组直到找到第一个不重复的单词,将`count_word`清零并跳出循环。 4. **计算百分比**: - 计算每个单词在整个文本中的出现频率(即百分比),使用公式`percent = 100.0 * count_word[k] / total`。 5. **结果输出**: - 在完成读取后,使用`fprintf()`函数将单词列表、计数和百分比写入到`result.txt`文件中,包括标题行和分割线。 6. **错误处理**: - 如果在任何阶段无法打开或操作文件,程序会显示错误信息,并让用户按任意键退出。 本文档展示了如何利用C语言的数组和文件操作功能来有效地处理文本数据,对单词进行计数和分析,是编程初学者学习文件读取和数据处理的好例子。通过这个过程,读者可以了解文件I/O的基本操作、数组的动态管理和数据处理算法。