python 当前路径下有一个文本文件article.txt，是一篇英文文章。编写一个程序，对文件中的单词根据长度进行分类和统计，标点符号忽略，相同的单词仅计算一次。分类和统计的结果按照一定格式存放，结果存放到new_article_classify.txt中

时间: 2024-02-06 12:11:00 浏览: 75

Python使用os.listdir()和os.walk()获取文件路径与文件下所有目录的方法

5星 · 资源好评率100%

今天小编就为大家分享一篇关于Python使用os.listdir()和os.walk()获取文件路径与文件下所有目录的方法，小编觉得内容挺不错的，现在分享给大家，具有很好的参考价值，需要的朋友一起跟随小编来看看吧 ### Python使用`os.listdir()`和`os.walk()`获取文件路径与文件下所有目录的方法在Python编程中，经常需要处理文件系统操作，如查找特定目录下的所有文件或递归地遍历整个目录结构。`os.listdir()` 和 `os.walk()` 是Python标准库中的两个非常有用的函数，它们可以帮助我们轻松完成这些任务。 #### `os.listdir()` 函数详解 `os.listdir()` 函数用于返回指定路径下的所有文件和文件夹名称的列表。如果未指定路径，则默认为当前工作目录。 **语法:** ```python os.listdir(path='') ``` - **参数**: - `path`: 字符串类型，代表需要列出其内容的目录路径。如果为空，默认为当前工作目录。 **返回值**: 返回一个字符串列表，包含了指定目录下的所有文件和文件夹名称。 **示例代码:** ```python import os # 获取当前工作目录下的所有文件和文件夹 files = os.listdir() print(files) # 获取指定路径下的所有文件和文件夹 path = 'C:\\Users\\YourUsername\\Documents' files = os.listdir(path) print(files) ``` #### `os.walk()` 函数详解 `os.walk()` 函数是一种更为强大的工具，它允许程序员递归地遍历目录树，即不仅可以获取顶层目录下的文件和文件夹，还可以获取其所有子目录下的文件和文件夹。 **语法:** ```python os.walk(top, topdown=True, onerror=None, followlinks=False) ``` - **参数**: - `top`: 字符串类型，代表需要遍历的目录树的路径。 - `topdown`: 布尔值，默认为 `True`，表示首先返回根目录树下的文件和文件夹，然后再遍历子目录。如果设置为 `False`，则先遍历子目录，最后返回根目录。 - `onerror`: 函数对象，默认为 `None`，当发生错误时被调用。如果不为空，则提供一个自定义函数来处理错误信息。 - `followlinks`: 布尔值，默认为 `False`，表示不遍历符号链接指向的目录。 **返回值**: 返回一个迭代器，对于每个遍历到的目录，都会生成一个三元组 `(root, dirs, files)`： - `root`: 字符串类型，当前遍历的目录路径。 - `dirs`: 列表类型，当前目录下的子目录列表。 - `files`: 列表类型，当前目录下的非目录文件列表。 **示例代码:** ```python import os def list_files(path): for root, dirs, files in os.walk(path): for file in files: full_path = os.path.join(root, file) print(full_path) if __name__ == '__main__': path = "C:\\Users\\Administrator\\Desktop\\2017-9-1" list_files(path) ``` **输出示例:** ``` C:\Users\Administrator\Desktop\2017-9-1\2017-9-1.txt C:\Users\Administrator\Desktop\2017-9-1\2017-9-1storage.txt C:\Users\Administrator\Desktop\2017-9-1\apk.conf C:\Users\Administrator\Desktop\2017-9-1\数据采集导入质量统计_2017-09-01.docx C:\Users\Administrator\Desktop\2017-9-1\test1\2017-9-1.txt C:\Users\Administrator\Desktop\2017-9-1\test2\2017-9-1.txt ``` #### 应用场景 - **应用1**: 当一个目录下面只有文件时，可以使用 `os.listdir()`。 **示例代码:** ```python import os path = r'C:\Users\XXN\Desktop\test_file' for each_file in os.listdir(path): print(os.path.join(path, each_file)) ``` - **应用2**: 当一个目录下面既有文件又有目录（文件夹）时，可使用 `os.walk()` 来递归读取所有文件和文件夹。 **示例代码:** ```python import os def list_files_and_dirs(path): for root, dirs, files in os.walk(path): print(f"Directory: {root}") for dir in dirs: print(f" Sub-directory: {os.path.join(root, dir)}") for file in files: print(f" File: {os.path.join(root, file)}") if __name__ == '__main__': path = "C:\\Users\\YourUsername\\Documents" list_files_and_dirs(path) ``` 通过上述介绍，我们可以看到 `os.listdir()` 和 `os.walk()` 这两个函数的强大功能及其在实际开发中的应用。它们能够帮助开发者高效地处理文件系统的各种问题，特别是在文件搜索、备份、归档等场景下。掌握这两个函数的使用方法将极大提高Python开发者的效率。

好的，我会为您解答这个问题。您可以使用Python中的正则表达式模块re来进行文本处理。以下是代码实现： ```python import re # 打开文件 with open('article.txt', 'r') as f: text = f.read() # 使用正则表达式提取所有单词，忽略标点符号 words = re.findall(r'\b[A-Za-z]+\b', text) # 对单词按照长度进行分类和统计 word_dict = {} for word in words: # 转换为小写字母 word = word.lower() # 如果单词已经在字典中，则增加计数器 if word in word_dict: word_dict[word] += 1 else: # 否则添加到字典中 word_dict[word] = 1 # 根据单词长度，将单词分到不同的列表中 classify_dict = {} for word, count in word_dict.items(): length = len(word) if length in classify_dict: classify_dict[length].append((word, count)) else: classify_dict[length] = [(word, count)] # 将分类和统计结果按照一定格式存放到new_article_classify.txt中 with open('new_article_classify.txt', 'w') as f: for length, word_list in classify_dict.items(): f.write(f"{length} letters:\n") for word, count in word_list: f.write(f"{word}: {count}\n") ``` 这个程序会将分类和统计结果按照以下格式存放到new_article_classify.txt中： ``` 4 letters: this: 1 from: 2 file: 1 ... 5 letters: world: 3 hello: 1 ... ... ```

阅读全文

相关推荐

Python高效统计文本文件英文单词计数法及优化

Python实现文本文件批量处理：删除、修改、编码转换

背英语单词python小程序（源码文件＋单词和汉译文本文件）

python语言如何输出内容到文本文件里面呢.txt

local_searching_engine_with_python：搜寻本地计算机并索引所有文件。 当您在程序中搜索任何单词后，程序会以.txt或.py格式找到您的单词。 如果您在程序中编写复杂的句子，程序会在搜索时间上出现一些错误

python实现的一个中文文本摘要程序.pdf

python从一个文本文件中读取数据，统计文件中每个单词的出现次数

python编写的纯文本txt转字幕文件srt/ass格式程序

Python中读取文本文件.pdf

python从一个文本文件中读取数据，然后计算并打印出文件中单词的频率

python编写一个程序，能在当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件，并打印出相对路径

实验四：Python程序设计之文件data.txt数据文件，完整版，可以画出完整图形

python pdf文件转文本txt文件代码

TransferCalculator:一个用Python编写的程序，它从文本文件中读取数据，以从FIFA游戏中的玩家那里获取统计信息，然后根据我为他们创建的权重计算其价格，从而更重要地根据位置为某些统计信息赋值

python获取当前文件路径以及父文件路径的方法

Python统计纯文本文件中英文单词出现个数的方法总结【测试可用】

【Python入门教程】第68篇读取文本文件.pdf

最新推荐

Python实现调用另一个路径下py文件中的函数方法总结

Python实现合并同一个文件夹下所有txt文件的方法示例

python统计文本文件内单词数量的方法

python如何将两个txt文件内容合并

python--shutil移动文件到另一个路径的操作

Angular程序高效加载与展示海量Excel数据技巧

管理建模和仿真的文件

【SecureCRT高亮技巧】：20年经验技术大佬的个性化设置指南

如何设计一个基于FPGA的多功能数字钟，实现24小时计时、手动校时和定时闹钟功能？

Argos客户端开发流程及Vue配置指南

local_searching_engine_with_python：搜寻本地计算机并索引所有文件。当您在程序中搜索任何单词后，程序会以.txt或.py格式找到您的单词。如果您在程序中编写复杂的句子，程序会在搜索时间上出现一些错误