遍历源文件夹中的所有文件 for file_name in os.listdir(source_folder): if file_name.endswith('.db'): # 连接源数据库 source_db = sqlite3.connect(os.path.join(source_folder, file_name)) source_cursor = source_db.cursor() # 获取源数据库中的所有表格名 source_cursor.execute("SELECT name FROM sqlite_master WHERE type='table';") tables = source_cursor.fetchall() # 遍历源数据库中的所有表格 for table in tables: table_name = table[0] # 读取源表格数据 source_cursor.execute(f"SELECT * FROM {table_name};") data = source_cursor.fetchall() # 获取源表格的列名 source_cursor.execute(f"PRAGMA table_info({table_name});") columns = [column[1] for column in source_cursor.fetchall()] # 创建目标表格（如果不存在） cursor.execute(f"CREATE TABLE IF NOT EXISTS {table_name} ({','.join(columns)});") # 插入源表格数据到目标表格 cursor.executemany(f"INSERT INTO {table_name} VALUES ({','.join(['?'] * len(columns))});", data)修改這段代碼，在匯總時忽略ID列的重複

时间: 2024-04-12 15:28:02 浏览: 94

解决python中os.listdir()函数读取文件夹下文件的乱序和排序问题

5星 · 资源好评率100%

在Python编程中，`os.listdir()` 是一个非常实用的函数，它用于获取指定路径下的所有文件和子目录的名称，返回的结果是一个包含字符串的列表。然而，这个函数的一个特点是返回的列表顺序并不是固定的，可能会根据文件系统内部的实现而有所不同，这可能会导致在处理大量文件时出现混乱。本文将详细介绍如何解决 `os.listdir()` 返回文件名乱序的问题，并提供一种排序解决方案。了解 `os.listdir()` 的基本用法。以下是一个简单的示例： ```python import os dir_path = 'F:/Home_01/img' # 指定目录路径 file_names = os.listdir(dir_path) # 获取目录中的文件和子目录名 ``` `file_names` 列表包含了 `dir_path` 目录下所有文件和子目录的名称，但这些名称并不保证按任何特定顺序排列。如果需要按照某种规则（如字母顺序、数字顺序等）排序，就需要对列表进行排序操作。针对数字序号的文件名，我们可以利用 Python 的 `sort()` 函数结合 `lambda` 表达式来实现。假设文件名格式为 `xx.jpg`，其中 `xx` 是两位数字，可以这样做： ```python file_names.sort(key=lambda x: int(x[:-4])) # 去掉'.jpg'之前的字符串并转换为整数进行排序 ``` 这里的 `key` 参数是一个函数，用于提供每个元素的排序依据。`lambda x: int(x[:-4])` 表示取字符串 `x` 从开头到倒数第四位（即 '.' 之前的部分），将其转换为整数。这样，文件名将按照数字部分从小到大排序。如果文件名格式不同，比如 `Chapter-01.txt`，则需要调整 `lambda` 表达式以适应文件名的结构，例如： ```python file_names.sort(key=lambda x: int(x.split('-')[-1].split('.')[0])) ``` 在这个例子中，我们使用 `split('-')` 将字符串按 '-' 分割，然后取最后一个元素，再用 `split('.')` 分割获取数字部分，最后将其转换为整数进行排序。总结来说，解决 `os.listdir()` 函数返回文件名乱序问题的关键在于对返回的列表进行自定义排序。通过设置 `sort()` 函数的 `key` 参数，可以根据文件名的具体结构定制排序逻辑，确保文件名按照预期顺序排列。在处理大量文件时，这种方法尤其有用，因为它可以提供一致性和可预测性，便于后续处理。

在进行数据插入时，可以通过修改SQL语句来忽略ID列的重复。修改后的代码如下： ```python # 遍历源数据库中的所有表格 for table in tables: table_name = table[0] # 读取源表格数据 source_cursor.execute(f"SELECT DISTINCT * FROM {table_name};") data = source_cursor.fetchall() # 获取源表格的列名 source_cursor.execute(f"PRAGMA table_info({table_name});") columns = [column[1] for column in source_cursor.fetchall() if column[1] != 'ID'] # 创建目标表格（如果不存在） cursor.execute(f"CREATE TABLE IF NOT EXISTS {table_name} ({','.join(columns)});") # 插入源表格数据到目标表格 cursor.executemany(f"INSERT INTO {table_name} ({','.join(columns)}) VALUES ({','.join(['?'] * len(columns))});", data) ``` 在这段代码中，我们使用了SELECT DISTINCT * 来获取数据，这样可以去除重复的行。同时，获取列名时排除了名为'ID'的列，避免重复插入。插入数据时也只插入了除去'ID'列以外的其他列。

阅读全文

相关推荐

dbf.rar_arcgis_arcgis python_site:www.pudn.com

遍历子文件和文件夹_遍历文件_遍历子文件和文件夹_

【pygments.lexer应用案例集】：从自动化脚本到专业代码编辑器插件

【Python文件处理的终极武器】：mimetypes库的性能优化与实战应用

一步到位：Paraview中文环境配置大揭秘

Web开发中的Shutil隐藏功能：集成与应用秘籍

【Python与XML：终极初学者指南】：从0到1打造高效数据交换

【GIMP脚本编写入门】：用Python简化GIMP操作的进阶技巧

【音频处理秘籍大公开】：用pydub库玩转音频切割与合并

python將一個文件夾中多個db文件中表格合并為一個表格名字為匯總的文件放到其他路徑中

基于freeRTOS和STM32F103x的手机远程控制浴室温度系统设计源码

LABVIEW程序实例-web写数据.zip

LABVIEW程序实例-前面板对象常用属性.zip

最新推荐

基于freeRTOS和STM32F103x的手机远程控制浴室温度系统设计源码

LABVIEW程序实例-web写数据.zip

LABVIEW程序实例-前面板对象常用属性.zip

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践

"互动学习：行动中的多样性与论文攻读经历"

【Shell脚本进阶】：wc命令行数统计的高级用法及解决方案