已知有一个正确单词索引表（保存在当前目录下的文件index.txt中，且全为小写字母，按照字典序由小到大排列，每个单词独占一行），编写程序利用该单词表对某一英文文章（保存在当前目录下的另一个文件in.txt中）进行单词正确性检查，若该英文文章中出现的单词（只有连续字母组成）没有出现在单词索引文件中（检查时大小写无关），则将该出错的单词（其中的字母全部转换为小写）输出到当前目录下的另一文件error.txt中，如果同一个单词连续出错，则将该单词重复输出，每个单词独占一行，并且以字典序由小到大的顺序输出。假设： 1、in.txt中的文章有可能没有经过排版，格式有可能杂乱无章，也有可能没有写完整。 2、index.txt中的单词个数不超过1000个，每个单词的长度不超过50个字母。 3、若出错的单词多次出现，则多次输出。

时间: 2024-01-22 17:19:13 浏览: 73

以下是Python3的程序实现： ```python # 读取单词索引表 with open('index.txt', 'r') as f: word_list = [word.strip().lower() for word in f.readlines()] # 读取英文文章 with open('in.txt', 'r') as f: article = f.read().lower() # 整理英文文章中的单词 import re pattern = re.compile('[a-z]+') word_set = set(pattern.findall(article)) # 检查单词正确性并输出错误单词 with open('error.txt', 'w') as f: for word in sorted(word_set): if word not in word_list: f.write(word + '\n') ``` 首先，我们读取单词索引表并将其中的单词保存到一个列表`word_list`中。然后，我们读取英文文章并将其中的文本内容全部转换为小写字母。接着，我们使用正则表达式找出英文文章中出现的所有连续字母组成的单词，并将这些单词保存到一个集合`word_set`中。注意，为了方便比较，我们将所有单词都转换为小写字母。最后，我们遍历`word_set`中的所有单词，如果某个单词不在`word_list`中，则将其写入到`error.txt`文件中。由于要求同一个单词连续出错时要重复输出，因此我们不需要对`word_set`进行去重操作，而是直接使用集合来保存单词，这样可以避免重复输出同一个单词。需要注意的是，由于英文文章的格式可能比较杂乱，因此我们需要使用正则表达式来找出其中的单词。正则表达式`[a-z]+`表示匹配由小写字母组成的连续字符串，`re.findall`函数会返回所有匹配的结果，并将它们保存到一个列表中。

阅读全文

相关推荐

解决C#链接MySQL数据库报错 '给定关键字不在字典中'

解决无法读取.csproj项目文件的问题

Web渗透测试常用URL目录字典

C#编程：解决txt文件读写汉字乱码问题及编码检测方法

RDPwrap.ini 配置文件Ver.10.0.17更新指南

036GraphTheory(图论) matlab代码.rar

026SVM用于分类时的参数优化，粒子群优化算法，用于优化核函数的c,g两个参数(SVM PSO)Matlab代码.rar

药店管理-JAVA-基于springBoot的药店管理系统的设计与实现（毕业论文+开题）

【网络】基于matlab高动态网络拓扑中OSPF网络计算【含Matlab源码 10964期】.zip

今天吴老师上课的时候说我.txt

检测骨架图像的交点Matlab代码.rar

MMC simulink 模块化多电平变流器 载波移相 双闭环仿真 输出谐波分析，线性自抗扰控制LADRC 有仿真文件

自动驾驶控制-斯坦利（stanely）算法路径跟踪仿真 matlab和carsim联合仿真搭建的无人驾驶斯坦利控制器仿真验证，可以实现双移线，圆形，以及其他自定义的路径跟踪 跟踪效果如图，几乎没有误

TongRDS替代Redis的基本部署和开发流程.zip

大家在看

MOOC工程伦理课后习题答案（主观+判断+选择）期末考试答案.docx

UD18415B_海康威视信息发布终端_快速入门指南_V1.1_20200302.pdf

一种应用于AMOLED的阵列扫描控制电路 (2011年)

基2，8点DIT-FFT，三级流水线verilog实现

Multisim里的NPN三极管参数资料大全.docx

最新推荐

用 Windows “记事本”创建一个文本文件，其中每行包含一段英文，试读出文件的全部内容，并判断：（1）该文本文件共有多少行？（2）文件中以大写字母P开头的有多少行？（3）一行包含字

036GraphTheory(图论) matlab代码.rar

026SVM用于分类时的参数优化，粒子群优化算法，用于优化核函数的c,g两个参数(SVM PSO)Matlab代码.rar

macOS 10.9至10.13版高通RTL88xx USB驱动下载

PyCharm开发者必备：提升效率的Python环境管理秘籍

matlab中VBA指令集

在Windows Forms和WPF中实现FontAwesome-4.7.0图形

【Postman进阶秘籍】：解锁高级API测试与管理的10大技巧

ubuntu22.04怎么恢复出厂设置

2001年度广告运作规划：高效利用资源的策略

MMC simulink 模块化多电平变流器载波移相双闭环仿真输出谐波分析，线性自抗扰控制LADRC 有仿真文件

自动驾驶控制-斯坦利（stanely）算法路径跟踪仿真 matlab和carsim联合仿真搭建的无人驾驶斯坦利控制器仿真验证，可以实现双移线，圆形，以及其他自定义的路径跟踪跟踪效果如图，几乎没有误