用python和正则表达式解决问题。【问题描述】 已知有一个正确单词索引表(保存在当前目录下的文件index.txt中,且全为小写字母,按照字典序由小到大排列,每个单词独占一行),编写程序利用该单词表对某一英文文章(保存在当前目录下的另一个文件in.txt中)进行单词正确性检查,若该英文文章中出现的单词(可能由连续字母组成或者连续字母和数字的组合)没有出现在单词索引文件中(检查时大小写无关),则将该出错的单词(其中的字母全部转换为小写)输出到当前目录下的另一文件error.txt中,每个单词独占一行,并且以字典序由小到大的顺序输出。 假设: 1、in.txt中的文章有可能没有经过排版,格式有可能杂乱无章,也有可能没有写完整。 2、index.txt中的单词个数不超过1000个,每个单词的长度不超过50个字母。 3、若出错的单词多次出现,则多次输出。 【输入形式】 保存单词索引表的文件index.txt和保存英文文章的文件in.txt都位于当前目录下。 【输出形式】 将出错的单词以字典序由小到大的顺序输出到当前目录下的文件error.txt中,每个单词单独占一行,多次出错的单词多次输出。若没有出现错误单词,则什么也不输出。
时间: 2024-01-22 18:19:10 浏览: 118
可以参考以下代码:
```python
import re
# 读取单词索引表
with open('index.txt', 'r') as f:
index_words = set([line.strip().lower() for line in f.readlines()])
# 检查英文文章
errors = set()
with open('in.txt', 'r') as f:
for line in f.readlines():
words = re.findall(r'\w+', line.lower())
for word in words:
if word not in index_words:
errors.add(word)
# 输出错误单词到error.txt
if errors:
with open('error.txt', 'w') as f:
for word in sorted(errors):
f.write(word + '\n')
```
代码解释:
首先读取单词索引表,并将单词转换成小写保存在一个集合中。然后遍历英文文章,使用正则表达式找出每行中的单词(忽略大小写),并判断是否在单词索引表中出现。如果没有出现,则将该单词加入错误集合中。最后,如果有错误单词,则将错误单词按字典序排序后输出到error.txt中。
阅读全文