用python实现：【问题描述】编写程序，打开一篇英文文章（存在当前目录下的文件in.txt中），为该文章生成词汇表（存到当前目录下的另一个文件words.txt中）。文章中单词指的是只由小写或大写字母组成的字符串，但词汇表中的单词都是以小写字母的形式出现，若文章中出现多个大小写无关的相同单词，只在词汇表中生成一个单词。假设生成的词汇表中单词个数不会超过100个，且每个单词的长度不会超过20。词汇表中的单词以字典顺序由小到大存放。【输入形式】输入的英文文章存储在当前目录下的文件in.txt中。【输出形式】输出的词汇表存储到当前目录下的文件words.txt中，每个单词独占一行，以字典顺序由小到大存放。【输入样例】假如in.txt中的文章内容如下： C was originally designed for and implemented on the UNIX operating system on the DEC PDP-11, by Dennis Ritchie. The book is not an introductory programming manual. 【输出样例】生成的词汇表存储在words.txt中，其内容应如下所示： an and book by c dec dennis designed for implemented introductory is manual not on operating originally pdp programming ritchie system the unix was 【样例说明】读入的英文文章中，所有的英文字母串（由一个或多个连续字母组成）都将对应生成词汇表中的一个单词，例如：文章中的两个the和一个The对应生成词汇表中单词the；单个字母C也作为单个单词出现，所以也对应生成词汇表中的一个单词c。

时间: 2024-01-22 11:18:20 浏览: 80

代码如下： ```python import string def generate_word_list(): # 打开文件并读取文章内容 with open('in.txt', 'r') as f: content = f.read() # 去除标点符号并转换为小写 for c in string.punctuation: content = content.replace(c, ' ') content = content.lower() # 将文章内容分割为单独的单词 words = content.split() # 去重并排序 word_list = sorted(list(set(words))) # 将词汇表写入文件 with open('words.txt', 'w') as f: for word in word_list: f.write(word + '\n') generate_word_list() ``` 该程序首先读取文件内容，并将其转换为小写。然后使用string库中的punctuation常量去除文章中的标点符号。接着使用split()函数将文章内容分割为单独的单词，并将其去重并排序。最后将词汇表写入文件。

用Python实现问题描述】编写程序，打开一篇英文文章（存在当前目录下的文件in.txt中），为该文章生成词汇表（存到当前目录下的另一个文件words.txt中）。文章中单词指的是只由小写或大写字母组成的字符串，但词汇表中的单词都是以小写字母的形式出现，若文章中出现多个大小写无关的相同单词，只在词汇表中生成一个单词。假设生成的词汇表中单词个数不会超过100个，且每个单词的长度不会超过20。词汇表中的单词以字典顺序由小到大存放。【输入形式】输入的英文文章存储在当前目录下的文件in.txt中。【输出形式】输出的词汇表存储到当前目录下的文件words.txt中，每个单词独占一行，以字典顺序由小到大存放

可以按照以下步骤实现： 1. 读取文件in.txt中的英文文章内容。 2. 将文章内容按照空格分割成单词。 3. 将单词转换为小写形式，忽略大小写相同的单词。 4. 将所有单词按照字典顺序排序。 5. 将所有单词写入文件words.txt中。具体代码如下： ```python import string # 读取文件 with open('in.txt', 'r') as f: content = f.read() # 去除标点符号并按照空格分割成单词 words = content.translate(str.maketrans('', '', string.punctuation)).split() # 将单词转换为小写形式，并去除大小写相同的单词 lower_words = set(word.lower() for word in words) # 按照字典顺序排序 sorted_words = sorted(lower_words) # 将所有单词写入文件words.txt中 with open('words.txt', 'w') as f: f.write('\n'.join(sorted_words)) ``` 执行完毕后，文件words.txt中将会存储所有单词的词汇表，每个单词占一行，按照字典顺序排列。

用python解决问题。【问题描述】编写程序，打开一篇英文文章（存在当前目录下的文件in.txt中），为该文章生成词汇表（存到当前目录下的另一个文件words.txt中）。文章中单词指的是只由小写或大写字母组成的字符串，但词汇表中的单词都是以小写字母的形式出现，若文章中出现多个大小写无关的相同单词，只在词汇表中生成一个单词。假设生成的词汇表中单词个数不会超过100个，且每个单词的长度不会超过20。词汇表中的单词以字典顺序由小到大存放。【输入形式】输入的英文文章存储在当前目录下的文件in.txt中。【输出形式】输出的词汇表存储到当前目录下的文件words.txt中，每个单词独占一行，以字典顺序由小到大存放。

这道题可以使用Python的文件操作和字典来解决。具体步骤如下： 1. 打开文件in.txt，读取文章内容为一个字符串。 2. 将文章字符串按照空格分割成单词列表。 3. 遍历单词列表，将每个单词转换成小写字母形式，去除标点符号和其他非字母字符。 4. 使用一个字典来记录每个单词在文章中出现的次数，以及是否已经被添加到词汇表中。 5. 遍历字典，将所有出现过的单词按照字典序排序后，写入文件words.txt中。下面是Python代码实现： ```python import string # 读取文件内容 with open('in.txt', 'r') as f: content = f.read() # 将文章字符串按照空格分割成单词列表 words = content.split() # 去除标点符号和其他非字母字符，转换为小写字母形式 words = [word.lower().strip(string.punctuation) for word in words] # 统计每个单词在文章中出现的次数，以及是否已经添加到词汇表中 word_count = {} for word in words: if len(word) > 0 and word.isalpha(): if word in word_count: word_count[word] += 1 else: word_count[word] = 1 # 添加到词汇表中 with open('words.txt', 'a') as f: f.write(word + '\n') # 按照字典序排序所有出现过的单词，写入文件words.txt中 with open('words.txt', 'r+') as f: lines = f.readlines() lines.sort() f.seek(0) f.writelines(lines) ``` 在运行完以上代码后，当前目录下的words.txt文件中就会包含文章中所有出现过的单词的词汇表，并且按照字典序排序。

阅读全文

相关推荐

采用python程序设计语言，进行分词，再去掉停用词和标点符号等，生成文档的词典，接着根据词典和文档内容生成词项的倒排记录表

采用python程序设计语言，进行分词，再去掉停用词和标点符号等，生成文档的词典

【feedparser彻底掌握】：从零基础到Python库文件使用高手

【Python矩阵运算调试技巧】：快速定位和修复问题的高级方法

【Sumy库跨平台使用】：确保Sumy在不同Python环境下的稳定运行

Python与JSON数据交互：异常处理的高级技巧

Python初学者指南

【Python3 Serial用户界面设计】：设计直观易用串口助手UI的完整流程

EIDORS文档脚本编写：自动化任务与处理的高级指南

实现多语言国际化：在Cocos Creator中进行多语言支持

ISE Text Editor与Notepad++编码处理深度剖析：实战篇

【PCAN-Explorer 5 全攻略】：掌握基础到专家的全方位技能（基础篇至用户权限篇）

【Feeds库与Web框架集成】：在Django_Flask中使用feeds库的秘诀

DCM转换工具箱：一次性掌握DICOM及其他格式转换

操作系统：深入剖析系统调用

Django任务调度：自动化重复性任务

PyCharm版本控制集成：Mercurial从入门到精通

PyCharm终端错误诊断与解决：开发者必备技能

大家在看

JESD209-5-Output.pdf

西软S酒店管理软件V3.0说明书

鲁大师 v5.1021.1300 LITE.rar

KEMET_聚合物钽电容推介资料

Chamber and Station test.pptx

最新推荐

基于springboot的酒店管理系统源码（java毕业设计完整源码+LW）.zip

蓄电池与超级电容混合储能并网matlab simulink仿真模型 （1）混合储能采用低通滤波器进行功率分配，可有效抑制功率波动，并对超级电容的soc进行能量管理，soc较高时多放电，较低时少放电

017 - 搞笑一句话台词.docx

基于微信小程序的购物系统+php后端毕业源码案例设计全部资料+详细文档.zip

基于APS.net的办公物品管理系统全部资料+详细文档.zip

WildFly 8.x中Apache Camel结合REST和Swagger的演示

管理建模和仿真的文件

【声子晶体模拟全能指南】：20年经验技术大佬带你从入门到精通

2024-07-27怎么用python转换成农历日期

FDFS客户端Python库1.2.6版本发布

蓄电池与超级电容混合储能并网matlab simulink仿真模型（1）混合储能采用低通滤波器进行功率分配，可有效抑制功率波动，并对超级电容的soc进行能量管理，soc较高时多放电，较低时少放电