Python实现单词分隔并保存到文件
在Python编程中,处理文本数据时,将文本文件中的每个单词独立地提取并保存到另一个文件中是一个常见的需求。本文档的核心代码展示了如何实现这一功能。首先,我们导入必要的库并定义一个名为`dcfenhang`的函数,该函数接收两个参数:一个是输入文件名(`infile`),另一个是输出文件名(`outfile`)。使用`open()`函数以UTF-8编码打开这两个文件。 ```python def dcfenhang(infile, outfile): # 以文本模式打开输入文件和输出文件,确保编码为UTF-8 infopen = open(infile, 'r', encoding='utf-8') outopen = open(outfile, 'w', encoding='utf-8') # 逐行读取输入文件 lines = infopen.readlines() # 对于每一行(line)中的内容,使用split()方法按照空格分割成单词列表(words) for line in lines: words = line.split() # 检查单词是否已经存在于输出文件中 for word in words: if word not in outopen: # 如果单词不在输出文件中,将其写入,每行末尾添加换行符 outopen.write(word + '\n') # 关闭文件操作,确保资源正确释放 infopen.close() outopen.close() ``` 在这个例子中,函数被调用`dcfenhang("jb51.txt", "fenci.txt")`,这意味着它会读取`jb51.txt`文件,将其中的单词按空格分开,然后将结果写入`fenci.txt`文件。例如,原始文件`jb51.txt`的内容: ``` welcometovisitjb51.net Thansverymuch ``` 会被处理成: ``` welcome to visit jb51.net Thanks very much ``` 这样,每个单词都在输出文件中单独占据一行。最后,文章提到了处理完后的一个预期输出图像,但实际输出的详细内容没有在提供的部分中给出。这个代码片段展示了Python如何优雅地处理文本数据,通过逐行读取、分割单词并确保新文件只包含独特单词。这对于文本预处理、数据分析或创建词汇表等任务非常有用。
![](https://csdnimg.cn/release/download_crawler_static/13762927/bg1.jpg)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![java](https://img-home.csdnimg.cn/images/20210720083646.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
- 粉丝: 5
- 资源: 920
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 京瓷TASKalfa系列维修手册:安全与操作指南
- 小波变换在视频压缩中的应用
- Microsoft OfficeXP详解:WordXP、ExcelXP和PowerPointXP
- 雀巢在线媒介投放策划:门户网站与广告效果分析
- 用友NC-V56供应链功能升级详解(84页)
- 计算机病毒与防御策略探索
- 企业网NAT技术实践:2022年部署互联网出口策略
- 软件测试面试必备:概念、原则与常见问题解析
- 2022年Windows IIS服务器内外网配置详解与Serv-U FTP服务器安装
- 中国联通:企业级ICT转型与创新实践
- C#图形图像编程深入解析:GDI+与多媒体应用
- Xilinx AXI Interconnect v2.1用户指南
- DIY编程电缆全攻略:接口类型与自制指南
- 电脑维护与硬盘数据恢复指南
- 计算机网络技术专业剖析:人才培养与改革
- 量化多因子指数增强策略:微观视角的实证分析
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)