已知有一个正确单词索引表（保存在当前目录下的文件index.txt中，且全为小写字母，按照字典序由小到大排列，每个单词独占一行），编写程序利用该单词表对某一英文文章（保存在当前目录下的另一个文件in.txt中）进行单词正确性检查，若该英文文章中出现的单词（只有连续字母组成）没有出现在单词索引文件中（检查时大小写无关），则将该出错的单词（其中的字母全部转换为小写）输出到当前目录下的另一文件error.txt中，每个单词独占一行，并且以字典序由小到大的顺序输出。假设： 1、in.txt中的文章有可能没有经过排版，格式有可能杂乱无章，也有可能没有写完整。 2、index.txt中的单词个数不超过1000个，每个单词的长度不超过50个字母。 3、若出错的单词多次出现，则多次输出。python

时间: 2024-01-22 15:19:23 浏览: 92

可以按照以下步骤实现： 1. 读取单词索引表，保存每个单词到一个集合中（为了快速查找）。 2. 读取英文文章，将其中的单词提取出来（只保留连续字母组成的字符串），并全部转换成小写。 3. 对于每个提取出来的单词，判断是否在单词索引集合中出现，如果没有出现则将其输出到错误文件中。 4. 将输出的错误单词按照字典序排序，并写入到错误文件中。以下是实现代码： ```python # 读取单词索引表 with open('index.txt', 'r') as f: word_set = set(line.strip().lower() for line in f) # 读取英文文章，提取单词 with open('in.txt', 'r') as f: text = f.read() words = [word.lower() for word in re.findall(r'\b[a-zA-Z]+\b', text)] # 检查单词是否在索引表中出现，输出错误单词 errors = sorted(set(word for word in words if word not in word_set)) with open('error.txt', 'w') as f: f.write('\n'.join(errors)) ``` 注意在代码中使用了正则表达式 `r'\b[a-zA-Z]+\b'` 来提取单词。该正则表达式表示匹配一个或多个连续的字母组成的单词。`\b` 表示单词边界，确保只匹配完整的单词。`\b` 前后的 `[]` 表示匹配任意一个字母。`+` 表示匹配一个或多个连续的字母。`re.findall` 函数会返回所有匹配的结果，保存在一个列表中。

阅读全文

相关推荐

数据集目录，其中 包含 26 个小写字母字符的大图像.rar

C# 链接mysql数据库 出现 给定关键字不在字典中

vlc-prev-next:Vlc Player扩展程序，可播放同一目录中的下一个和上一个文件

免费的防止锁屏小软件，可用于域统一管控下的锁屏机制

Python代码实现带装饰的圣诞树控制台输出

白色大气风格的设计师作品模板下载.zip

电商平台开发需求文档.doc

白色简洁风格的办公室室内设计门户网站模板下载.zip

VB+access干部档案管理系统(源代码+系统)(20246t).7z

VB+ACCESS服装专卖店管理系统设计(源代码+系统+开题报告+答辩PPT)(2024ra).7z

(179065812)基于Android stduio的手机银行开发与设计-用于课程设计

白色大气风格的婚礼现场倒计时模板下载.zip

轮式移动机器人轨迹跟踪的MATHLAB程序，运用运动学和动力学模型的双闭环控制，借鉴自抗扰控制技术结合了非线性ESO，跟踪效果良好，控制和抗扰效果较优，可分享控制结构图 这段程序主要是一个小车的动力

vb+ACCESS学生档案管理系统(论文+源代码)(2024ql).7z

大家在看

MSC.MARC python后处理库py_post（数据提取）

WebBrowser脚本错误的完美解决方案

RealityCapture中文教程

二维Hilbert-Huang变换及其在图像增强中的应用 (2009年)

matlab-基于互相关的亚像素图像配准算法的matlab仿真-源码

最新推荐

用 Windows “记事本”创建一个文本文件，其中每行包含一段英文，试读出文件的全部内容，并判断：（1）该文本文件共有多少行？（2）文件中以大写字母P开头的有多少行？（3）一行包含字

免费的防止锁屏小软件，可用于域统一管控下的锁屏机制

Python代码实现带装饰的圣诞树控制台输出

白色大气风格的设计师作品模板下载.zip

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

"互动学习：行动中的多样性与论文攻读经历"

数据集目录，其中包含 26 个小写字母字符的大图像.rar

C# 链接mysql数据库出现给定关键字不在字典中

轮式移动机器人轨迹跟踪的MATHLAB程序，运用运动学和动力学模型的双闭环控制，借鉴自抗扰控制技术结合了非线性ESO，跟踪效果良好，控制和抗扰效果较优，可分享控制结构图这段程序主要是一个小车的动力