Python文件操作进阶:遍历文件夹及其子文件夹,轻松管理文件结构

发布时间: 2024-06-21 14:01:50 阅读量: 86 订阅数: 34
![Python文件操作进阶:遍历文件夹及其子文件夹,轻松管理文件结构](https://img-blog.csdnimg.cn/img_convert/f13a75196568cd249f3b4cf294fea96f.png) # 1. Python文件操作基础** Python提供了丰富的文件操作模块,如`os`和`shutil`,可以轻松地处理文件和文件夹。本章将介绍文件操作的基础知识,包括打开、读取、写入和关闭文件。 首先,需要使用`open()`函数打开一个文件。该函数接受两个参数:文件名和模式。模式指定打开文件的目的,如`'r'`表示只读,`'w'`表示只写,`'a'`表示追加。 打开文件后,可以使用`read()`方法读取文件内容,`write()`方法写入文件内容,`close()`方法关闭文件。`read()`方法返回文件内容的字符串,`write()`方法不返回任何值。 # 2. 遍历文件夹及其子文件夹 ### 2.1 递归遍历文件夹 递归遍历文件夹是一种深度优先遍历算法,它会首先遍历当前文件夹中的所有文件和目录,然后递归地遍历每个子文件夹中的文件和目录。 #### 2.1.1 os.walk()函数的用法 Python中可以使用`os.walk()`函数来递归遍历文件夹。`os.walk()`函数返回一个三元组,其中: * 第一个元素是当前文件夹的路径。 * 第二个元素是一个包含当前文件夹中所有子目录的列表。 * 第三个元素是一个包含当前文件夹中所有文件的列表。 ```python import os # 遍历当前目录及其子目录 for root, dirs, files in os.walk('.'): print(f"Current directory: {root}") print(f"Subdirectories: {dirs}") print(f"Files: {files}") ``` **代码逻辑逐行解读:** 1. 导入`os`模块。 2. 使用`os.walk('.')`遍历当前目录及其子目录。 3. 对于每个三元组`(root, dirs, files)`: - 打印当前目录的路径。 - 打印当前目录中的所有子目录。 - 打印当前目录中的所有文件。 #### 2.1.2 遍历子文件夹中的文件和目录 要递归地遍历子文件夹中的文件和目录,可以在`os.walk()`函数的循环中使用嵌套循环: ```python import os # 遍历当前目录及其子目录 for root, dirs, files in os.walk('.'): print(f"Current directory: {root}") print(f"Subdirectories: {dirs}") print(f"Files: {files}") # 遍历当前目录中的子目录 for subdir in dirs: print(f"Subdirectory: {subdir}") # 遍历子目录中的文件 for file in os.listdir(subdir): print(f"File: {file}") ``` **代码逻辑逐行解读:** 1. 导入`os`模块。 2. 使用`os.walk('.')`遍历当前目录及其子目录。 3. 对于每个三元组`(root, dirs, files)`: - 打印当前目录的路径。 - 打印当前目录中的所有子目录。 - 打印当前目录中的所有文件。 4. 对于当前目录中的每个子目录`subdir`: - 打印子目录的名称。 5. 对于子目录`subdir`中的每个文件`file`: - 打印文件的名称。 ### 2.2 非递归遍历文件夹 非递归遍历文件夹是一种广度优先遍历算法,它会首先遍历当前文件夹中的所有文件和目录,然后依次遍历每个子文件夹中的文件和目录。 #### 2.2.1 os.listdir()函数的用法 Python中可以使用`os.listdir()`函数来非递归遍历文件夹。`os.listdir()`函数返回一个包含当前文件夹中所有文件和目录的列表。 ```python import os # 遍历当前目录 for file in os.listdir('.'): print(f"File or directory: {file}") ``` **代码逻辑逐行解读:** 1. 导入`os`模块。 2. 使用`os.listdir('.')`遍历当前目录。 3. 对于当前目录中的每个文件或目录`file`: - 打印文件或目录的名称。 #### 2.2.2 使用队列实现非递归遍历 要使用队列实现非递归遍历文件夹,可以将当前文件夹中的所有文件和目录添加到队列中,然后依次从队列中取出文件或目录进行遍历: ```python import os from collections import deque # 创建一个队列 queue = deque() # 将当前目录中的所有文件和目录添加到队列中 for file in os.listdir('.'): queue.append(file) # 遍历队列中的文件和目录 while queue: # 从队列中取出一个文件或目录 file = queue.popleft() # 如果是目录,则将其中的所有文件和目录添加到队列中 if os.path.isdir(file): for subfile in os.listdir(file): queue.append(os.path.join(file, subfile)) # 如果是文件,则打印文件名称 else: print(f"File: {file}") ``` **代码逻辑逐行解读:** 1. 导入`os`和`collections.deque`模块。 2. 创建一个队列`queue`。 3. 将当前目录中的所有文件和目录添加到队列中。 4. 遍历队列中的文件和目录: - 从队列中取出一个文件或目录`file`。 - 如果`file`是目录,则将其中的所有文件和目录添加到队列中。 - 如果`file`是文件,则打印文件名称。 # 3. 管理文件结构 ### 3.1 创建和删除文件夹 #### 3.1.1 os.makedirs()函数的用法 `os.makedirs()`函数用于创建多级目录。语法如下: ```python os.makedirs(path, exist_ok=False) ``` * **path**:要创建的目录路径。 * **exist_ok**:如果目录已存在,是否引发异常。默认值为`False`,表示如果目录已存在,将引发`FileExistsError`异常。 **代码块:** ```python import os # 创建多级目录 os.makedirs('my_directory/sub_directory/sub_sub_directory') ``` **逻辑分析:** 该代码块使用`os.makedirs()`函数创建名为`my_directory/sub_directory/sub_sub_directory`的多级目录。如果目录已存在,将引发`FileExistsError`异常。 #### 3.1.2 os.rmdir()函数的用法 `os.rmdir()`函数用于删除空目录。语法如下: ```python os.rmdir(path) ``` * **path**:要删除的目录路径。 **代码块:** ```python import os # 删除空目录 os.rmdir('my_directory/sub_directory') ``` **逻辑分析:** 该代码块使用`os.rmdir()`函数删除名为`my_directory/sub_directory`的空目录。如果目录不为空或不存在,将引发`OSError`异常。 ### 3.2 移动和重命名文件 #### 3.2.1 os.rename()函数的用法 `os.rename()`函数用于移动或重命名文件。语法如下: ```python os.rename(src, dst) ``` * **src**:要移动或重命名的文件路径。 * **dst**:目标文件路径。 **代码块:** ```python import os # 移动文件 os.rename('old_file.txt', 'new_file.txt') # 重命名文件 os.rename('file.txt', 'file_renamed.txt') ``` **逻辑分析:** 该代码块使用`os.rename()`函数移动文件`old_file.txt`到`new_file.txt`,并重命名文件`file.txt`为`file_renamed.txt`。 #### 3.2.2 os.replace()函数的用法 `os.replace()`函数用于原子地移动或重命名文件。语法如下: ```python os.replace(src, dst) ``` * **src**:要移动或重命名的文件路径。 * **dst**:目标文件路径。 **代码块:** ```python import os # 原子地移动文件 os.replace('old_file.txt', 'new_file.txt') # 原子地重命名文件 os.replace('file.txt', 'file_renamed.txt') ``` **逻辑分析:** 该代码块使用`os.replace()`函数原子地移动文件`old_file.txt`到`new_file.txt`,并原子地重命名文件`file.txt`为`file_renamed.txt`。原子操作保证了文件操作的完整性和一致性。 ### 3.3 复制文件 #### 3.3.1 shutil.copyfile()函数的用法 `shutil.copyfile()`函数用于复制文件。语法如下: ```python shutil.copyfile(src, dst) ``` * **src**:要复制的文件路径。 * **dst**:目标文件路径。 **代码块:** ```python import shutil # 复制文件 shutil.copyfile('file1.txt', 'file2.txt') ``` **逻辑分析:** 该代码块使用`shutil.copyfile()`函数复制文件`file1.txt`到`file2.txt`。 #### 3.3.2 shutil.copytree()函数的用法 `shutil.copytree()`函数用于复制目录及其子目录和文件。语法如下: ```python shutil.copytree(src, dst) ``` * **src**:要复制的目录路径。 * **dst**:目标目录路径。 **代码块:** ```python import shutil # 复制目录 shutil.copytree('directory1', 'directory2') ``` **逻辑分析:** 该代码块使用`shutil.copytree()`函数复制目录`directory1`及其子目录和文件到`directory2`。 # 4. 进阶文件操作技巧 ### 4.1 文件内容处理 #### 4.1.1 读写文件内容 文件内容的读写是文件操作中最基本的操作。Python提供了多种方法来读写文件内容。 **读取文件内容** ```python with open('file.txt', 'r') as f: content = f.read() ``` **写入文件内容** ```python with open('file.txt', 'w') as f: f.write('Hello, world!') ``` **参数说明:** - `open()` 函数的第一个参数指定要打开的文件路径。 - `'r'` 表示以只读模式打开文件。 - `'w'` 表示以只写模式打开文件。 - `with` 语句确保在处理文件后自动关闭文件。 #### 4.1.2 追加和截断文件内容 除了读写文件内容,Python还允许追加和截断文件内容。 **追加文件内容** ```python with open('file.txt', 'a') as f: f.write('This is a new line.') ``` **截断文件内容** ```python with open('file.txt', 'w') as f: f.truncate() ``` **参数说明:** - `'a'` 表示以追加模式打开文件。 - `truncate()` 方法将文件内容截断为 0 字节。 ### 4.2 文件属性操作 #### 4.2.1 获取文件属性 Python提供了多种方法来获取文件属性,例如文件大小、修改时间和访问权限。 ```python import os file_path = 'file.txt' # 获取文件大小 file_size = os.path.getsize(file_path) # 获取文件修改时间 file_mtime = os.path.getmtime(file_path) # 获取文件访问权限 file_perms = os.path.getmode(file_path) ``` **参数说明:** - `os.path.getsize()` 返回文件大小(以字节为单位)。 - `os.path.getmtime()` 返回文件最后修改时间(以时间戳为单位)。 - `os.path.getmode()` 返回文件访问权限(以八进制数字表示)。 #### 4.2.2 修改文件属性 在某些情况下,您可能需要修改文件属性。Python允许您修改文件修改时间和访问权限。 ```python import os file_path = 'file.txt' # 修改文件修改时间 os.utime(file_path, (1654041600, 1654041600)) # 修改文件访问权限 os.chmod(file_path, 0o644) ``` **参数说明:** - `os.utime()` 函数接受一个文件路径和一个包含新修改时间和访问时间的元组。 - `os.chmod()` 函数接受一个文件路径和一个八进制数字,表示新的访问权限。 ### 4.3 文件搜索和过滤 #### 4.3.1 glob.glob() 函数的用法 `glob.glob()` 函数用于搜索与给定模式匹配的文件。 ```python import glob # 搜索所有以 .txt 结尾的文件 files = glob.glob('*.txt') ``` **参数说明:** - `glob.glob()` 函数接受一个模式字符串,表示要搜索的文件。 #### 4.3.2 fnmatch.fnmatch() 函数的用法 `fnmatch.fnmatch()` 函数用于测试一个文件名是否与给定的模式匹配。 ```python import fnmatch # 测试一个文件名是否与模式匹配 result = fnmatch.fnmatch('file.txt', '*.txt') ``` **参数说明:** - `fnmatch.fnmatch()` 函数接受一个文件名和一个模式字符串。 # 5. 实践应用案例 ### 5.1 自动化文件归档 **目标:** 编写一个脚本,自动将特定文件夹中的文件归档到指定位置。 **步骤:** 1. **导入必要的模块:** ```python import os import shutil import zipfile ``` 2. **定义要归档的文件夹和目标位置:** ```python source_dir = "path/to/source_folder" target_dir = "path/to/target_folder" ``` 3. **遍历源文件夹中的文件:** ```python for root, dirs, files in os.walk(source_dir): for file in files: # 获取文件的绝对路径 file_path = os.path.join(root, file) ``` 4. **创建归档文件:** ```python with zipfile.ZipFile(os.path.join(target_dir, "archive.zip"), "w") as zip_file: # 将文件添加到归档文件中 zip_file.write(file_path, os.path.relpath(file_path, source_dir)) ``` ### 5.2 文件系统监控和备份 **目标:** 创建一个监控文件系统更改的脚本,并在检测到更改时备份受影响的文件。 **步骤:** 1. **导入必要的模块:** ```python import os import time import shutil ``` 2. **定义要监控的文件夹:** ```python watch_dir = "path/to/watch_folder" ``` 3. **获取初始文件列表:** ```python initial_files = os.listdir(watch_dir) ``` 4. **进入监控循环:** ```python while True: # 获取当前文件列表 current_files = os.listdir(watch_dir) # 比较当前文件列表和初始文件列表 added_files = set(current_files) - set(initial_files) removed_files = set(initial_files) - set(current_files) # 处理添加和删除的文件 for file in added_files: shutil.copy(os.path.join(watch_dir, file), "path/to/backup_folder") for file in removed_files: # 处理删除的文件 pass # 更新初始文件列表 initial_files = current_files # 等待一段时间后再重新检查 time.sleep(1) ``` ### 5.3 文件内容处理和转换 **目标:** 编写一个脚本,将特定格式的文件内容转换为另一种格式。 **步骤:** 1. **导入必要的模块:** ```python import os import csv import json ``` 2. **定义要转换的文件和目标格式:** ```python input_file = "path/to/input.csv" output_file = "path/to/output.json" ``` 3. **读取 CSV 文件:** ```python with open(input_file, "r") as csv_file: reader = csv.reader(csv_file) data = list(reader) ``` 4. **将数据转换为 JSON:** ```python json_data = json.dumps(data) ``` 5. **写入 JSON 文件:** ```python with open(output_file, "w") as json_file: json_file.write(json_data) ```
corwn 最低0.47元/天 解锁专栏
送3个月
点击查看下一篇
profit 百万级 高质量VIP文章无限畅学
profit 千万级 优质资源任意下载
profit C知道 免费提问 ( 生成式Al产品 )

相关推荐

李_涛

知名公司架构师
拥有多年在大型科技公司的工作经验,曾在多个大厂担任技术主管和架构师一职。擅长设计和开发高效稳定的后端系统,熟练掌握多种后端开发语言和框架,包括Java、Python、Spring、Django等。精通关系型数据库和NoSQL数据库的设计和优化,能够有效地处理海量数据和复杂查询。
专栏简介
本专栏深入探讨了 Python 文件操作的各个方面,从获取文件夹下所有文件名到处理大文件和使用文件锁。通过一系列文章,您将掌握 Python 文件操作的核心技能,包括: * 遍历文件夹及其子文件夹 * 获取指定目录下所有文件 * 读取和写入文件 * 复制、移动和删除文件 * 创建和解压 ZIP 文件 * 比较两个文件的内容 * 使用文件锁避免并发操作冲突 * 使用文件管道提升效率 * 使用文件上下文管理器安全高效地处理文件 * 处理文件编码 * 使用文件迭代器逐行读取文件内容 * 使用文件缓冲优化读写性能 * 使用文件对象全面掌控文件操作 * 使用文件句柄直接访问文件数据 * 使用文件属性获取元数据信息 * 使用文件描述符底层操作文件系统 无论您是 Python 初学者还是经验丰富的开发人员,本专栏都将帮助您提升文件操作效率,轻松管理文件结构,并解决常见的文件操作难题。

专栏目录

最低0.47元/天 解锁专栏
送3个月
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
C知道 免费提问 ( 生成式Al产品 )

最新推荐

【Django验证器的测试与维护】:确保验证器稳定性的最佳实践

![python库文件学习之django.core.validators](https://www.djangotricks.com/media/tricks/2021/5nYn97f8v3Mu/trick.png) # 1. Django验证器概述 Django验证器是用于验证模型数据的强大工具,确保数据的完整性和准确性。它主要通过两种方式实现:在模型字段定义中直接声明,或在表单的清理方法中使用。Django内置了一系列的验证器,例如`EmailValidator`和`RegexValidator`,可以满足大多数基本的验证需求。然而,对于更复杂的数据验证逻辑,开发者往往需要自定义验证器来

【Django静态文件监控工具】:监控服务状态的5大工具与实践

![【Django静态文件监控工具】:监控服务状态的5大工具与实践](https://static.djangoproject.com/img/logos/django-logo-negative.1d528e2cb5fb.png) # 1. Django静态文件监控工具概述 Django作为一款流行的Python Web框架,其静态文件管理机制对于提高网站的性能至关重要。静态文件,如CSS、JavaScript和图片等,通常在服务器上不会频繁变动,但对于Web应用的用户体验和响应速度却有着显著影响。随着项目规模的增长,静态文件的数量和更新频率也会相应增加,这就需要一个有效的监控工具来确保这

webtest异步测试:处理异步HTTP请求的挑战与技巧

![webtest异步测试:处理异步HTTP请求的挑战与技巧](https://opengraph.githubassets.com/6e7141b556734555eea00ae4e1af6db81693f1dc4ff1f9a9b1c8e60068b0e750/iarks/random_org-api-example) # 1. 异步HTTP请求的基础概念 在现代Web应用中,异步HTTP请求是实现动态交互的关键技术之一。它允许浏览器在不重新加载页面的情况下与服务器通信,从而提升用户体验。异步请求通过AJAX(Asynchronous JavaScript and XML)技术实现,通常由

Python库文件学习之compiler.pycodegen:从编译器到解释器:原理与实践的全面解析

![Python库文件学习之compiler.pycodegen:从编译器到解释器:原理与实践的全面解析](https://d2vlcm61l7u1fs.cloudfront.net/media/12b/12b191a3-e2fd-4061-bb35-c73a8790d46b/phprdjDRQ.png) # 1. compiler.pycodegen库概述 ## 简介 `compiler.pycodegen` 是一个用于生成Python代码的库,它提供了一种将抽象语法树(AST)转换为可执行Python代码的机制。在Python的世界里,这个库扮演着代码生成器的角色,能够帮助开发者理解和操

Python中的Win32Security:使用Python库进行Windows安全性的5大创新应用

![Python中的Win32Security:使用Python库进行Windows安全性的5大创新应用](https://itprotv-image-bucket.s3.amazonaws.com/techskills-pythonforsecurity/techskills-pythonforsecurity-0-0-overview-081017-PGM.00_05_39_22.Still001-med.jpg) # 1. Win32Security库概述 ## 简介 Win32Security库是Windows平台上一个重要的安全框架,它为开发者提供了丰富的API,用于实现用户身份验

【加密库性能提升大揭秘】:优化Crypto.PublicKey操作性能的秘诀

![【加密库性能提升大揭秘】:优化Crypto.PublicKey操作性能的秘诀](https://opengraph.githubassets.com/bc986605c0cb22dd560099af033ee08f83e7de29810839cf62b230a3f19e0ed0/matter-labs/era-boojum-cuda) # 1. 加密库的基本原理与重要性 在当今数字化的世界中,加密库是保障数据安全的基石。它们利用复杂的数学算法,将明文转换为密文,确保只有授权方才能解读信息。这种转换过程依赖于密钥,密钥的长度和类型直接影响加密的强度和效率。 加密库的重要性不言而喻,它们不

【空间索引的艺术】:提升性能的django.contrib.gis.db.models索引策略

![【空间索引的艺术】:提升性能的django.contrib.gis.db.models索引策略](https://www.thedataschool.co.uk/content/images/2023/08/image-328.png) # 1. 空间索引的概念与重要性 ## 空间索引的基本概念 空间索引是一种专门用于处理地理空间数据的索引机制。它能够高效地组织和检索地理信息系统(GIS)中的空间对象,如点、线、面等。空间索引的目的是为了加速空间查询操作,如空间位置的检索、空间关系的判断等。 ## 空间索引的重要性 在处理大量空间数据时,没有空间索引,数据库的查询效率会大大降低,因为数

Python Path库实战演练:自动化文件处理的5大秘诀

![Python Path库实战演练:自动化文件处理的5大秘诀](https://i0.wp.com/www.tutorialbrain.com/wp-content/uploads/2021/03/Python-Create-Object-1.png?w=1422&ssl=1) # 1. Python Path库简介与安装 Python的Path库是一个强大的第三方库,主要用于处理文件路径。它提供了一系列简洁、直观的方法,使得路径操作变得更加容易和直观。Path库本质上是对os.path和glob模块的功能封装,让开发者能够以面向对象的方式进行路径操作。 在开始使用Path库之前,首先需

Django迁移对性能的影响:通过django.core.management.sql进行优化

![python库文件学习之django.core.management.sql](https://opengraph.githubassets.com/ca663e9fd27f8fc1de80dc4cb68a8f93ff3801e93be8e771cef346c92bb58b27/sleep3r/django-editable-table) # 1. Django迁移基础和性能挑战 ## 迁移的基本概念 Django迁移是Django框架中用于数据库模式管理和版本控制的机制。它允许开发者通过编写Python代码来描述数据库模式的变化,而不是直接操作数据库。迁移文件记录了自应用程序创建以来

【模块化设计中的Symbol模块】:模块化编程的利器,如何实现高效设计

![模块化设计](https://img-blog.csdnimg.cn/3f3cd97135434f358076fa7c14bc9ee7.png) # 1. 模块化编程的基本概念 在现代软件开发中,模块化编程是一种将复杂系统分解为更小、更易于管理的部分的方法。这种方法不仅有助于代码的组织和重用,还提高了项目的可维护性和可扩展性。模块化编程的核心在于创建独立的模块,每个模块都有明确的接口和职责。这些模块可以独立开发和测试,然后在系统中组合使用。 模块化编程可以追溯到早期的计算机科学实践,随着编程语言和开发工具的发展,它已经成为现代软件开发的标准实践之一。模块化编程不仅仅是编程风格的选择,它

专栏目录

最低0.47元/天 解锁专栏
送3个月
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
C知道 免费提问 ( 生成式Al产品 )