import pandas as pd # 读取新EXCEL df = pd.DataFrame({'序号': [1, 2, 3, 4], '表名': ['西部公司', '东部公司','东部公司', '西部公司'], 'sheet名': ['表一', '表三','二', '表四'], '姓名': ['Malehhjkjkgkjjgkgjk', 'Femalestrehree', 'Femalegrhreherdfdfdfh', 'Maledfgfdgdfdg'], '金额': [2, 2, 2, 2]}) 把df按照sheet名列关键字['四','三','二','一']先后顺序排序

可以使用Pandas的sort_values()方法按照指定列进行排序，代码如下： ```python # 按照sheet名列关键字['四','三','二','一']先后顺序排序 df = df.sort_values('sheet名', key=lambda x: x.map({'一': 0, '二': 1, '三': 2, '四': 3})) ``` 这里的`key`参数指定了一个lambda函数，用于将'sheet名'列中的值映射为数字0~3，然后按照这个数字进行排序。最终的排序结果如下： ``` 序号表名 sheet名姓名金额 2 3 东部公司二 Femalegrhreherdfdfdfh 2 1 2 东部公司三 Femalestrehree 2 0 1 西部公司一 Malehhjkjkgkjjgkgjk 2 3 4 西部公司四 Maledfgfdg 2 ```

import xlwt import pandas as pd # 读取新EXCEL df = pd.DataFrame({'序号': [1, 2, 3, 4], '表名': ['西部公司', '东部公司','东部公司', '西部公司'], 'sheet名': ['表一', '表三','二', '表四'], '姓名': ['Malehhjkjkgkjjgkgjk', 'Femalestrehree', 'Femalegrhreherdfdfdfh', 'Maledfgfdgdfdg'], '金额': [2, 2, 2, 2]}) 把df按照关键字['四','三','二','一']先后顺序排序

可以使用 Pandas 的 `Categorical` 类型进行排序，具体实现代码如下： ```python import pandas as pd # 创建 DataFrame df = pd.DataFrame({ '序号': [1, 2, 3, 4], '表名': ['西部公司', '东部公司', '东部公司', '西部公司'], 'sheet名': ['表一', '表三', '二', '表四'], '姓名': ['Malehhjkjkgkjjgkgjk', 'Femalestrehree', 'Femalegrhreherdfdfdfh', 'Maledfgfdgdfdg'], '金额': [2, 2, 2, 2] }) # 按照指定顺序排序 order = ['四', '三', '二', '一'] df['sheet名'] = pd.Categorical(df['sheet名'], categories=order, ordered=True) df = df.sort_values('sheet名') print(df) ``` 输出结果如下： ``` 序号表名 sheet名姓名金额 2 3 东部公司二 Femalegrhreherdfdfdfh 2 1 2 东部公司三 Femalestrehree 2 0 1 西部公司表一 Malehhjkjkgkjjgkgjk 2 3 4 西部公司表四 Maledfgfdgdfdg 2 ```

修改如下代码，读取多个execl表，保留第一行表的前面2行，跳过其余表的前面2行，合并之后的所有数据：import pandas as pd # 读取第一个 Excel 表格的前两行数据 df1 = pd.read_excel('附件一：2022年12月末存量公司客户管户认领情况表海沧-1.xlsx', header=[0, 1], nrows=2) # 定义一个空的 DataFrame，用于存储所有 Excel 表格的数据 result = pd.DataFrame() # 循环读取其他 Excel 表格的数据，跳过前两行，拼接到 result 中 for file in [ '附件三：2022年12月末存量机构客户管户认领情况表海沧支行-1.xlsx', '附件二：2023年3月末新拓公司客户管户认领情况表海沧-1.xlsx', '附件四：2023年3月末新拓机构客户管户认领情况表海沧支行-1.xlsx' ]: df = pd.read_excel(file, header=[0, 1], skiprows=2) result = pd.concat([result, df], ignore_index=True) # 将第一个 Excel 表格的前两行和拼接后的所有数据合并，替换列名和行名中的特殊字符 df = pd.concat([df1, result], ignore_index=True) # 输出到新的 Excel 表格中 df.to_excel('new_file.xlsx', index=False)

好的，你的代码已经能够读取多个 Excel 表格并合并了，但是有一个问题是，对于第一个 Excel 表格，你只保留了前两行，而对于其他的 Excel 表格，你却跳过了前两行。这就导致了合并后的 DataFrame 中，第一个 Excel 表格的数据行比其他 Excel 表格多了两行，从而引起了问题。如果你希望保留第一个 Excel 表格的前两行，同时也保留其他 Excel 表格的所有数据行，可以将 skiprows 参数改为一个列表，如 [0, 1]，这样第一个 Excel 表格的前两行会被保留，而其他 Excel 表格的前两行会被跳过。修改后的代码如下： ``` import pandas as pd # 读取第一个 Excel 表格的前两行数据 df1 = pd.read_excel('附件一：2022年12月末存量公司客户管户认领情况表__海沧-1.xlsx', header=[0, 1], nrows=2) # 定义一个空的 DataFrame，用于存储所有 Excel 表格的数据 result = pd.DataFrame() # 循环读取其他 Excel 表格的数据，保留第一行表的前两行，其余表跳过前两行，拼接到 result 中 for i, file in enumerate([ '附件三：2022年12月末存量机构客户管户认领情况表__海沧支行-1.xlsx', '附件二：2023年3月末新拓公司客户管户认领情况表__海沧-1.xlsx', '附件四：2023年3月末新拓机构客户管户认领情况表__海沧支行-1.xlsx' ]): skiprows = [0, 1] if i == 0 else 2 df = pd.read_excel(file, header=[0, 1], skiprows=skiprows) result = pd.concat([result, df], ignore_index=True) # 将第一个 Excel 表格的前两行和拼接后的所有数据合并，替换列名和行名中的特殊字符 df = pd.concat([df1, result], ignore_index=True) df.columns = [col.replace(' ', '_').replace(':', '_').replace('/', '_') for col in df.columns] df.index = [idx.replace(' ', '_').replace(':', '_').replace('/', '_') for idx in df.index] # 输出到新的 Excel 表格中 df.to_excel('new_file.xlsx', index=False) ``` 在代码中，使用了 enumerate() 函数来获取当前循环的表格序号 i，然后根据 i 的值来决定是否跳过前两行。对于第一个 Excel 表格，i 的值为 0，因此使用 [0, 1] 保留前两行；对于其他 Excel 表格，i 的值不为 0，因此跳过前两行。

阅读全文

相关推荐

Python pandas.DataFrame操作指南：创建、索引、增删

Pandas读取Excel参数详解：pd.read_excel操作与实践

使用pandas读取Excel：pd.read_excel全面解析与参数实例

Python3.5 Pandas DataFrame详解：创建、读取、过滤操作

Pandas数据合并与重塑：pd.concat深度解析

基于Andorid的音乐播放器项目改进版本设计.zip

uniapp-machine-learning-from-scratch-05.rar

game_patch_1.30.21.13250.pak

【毕业设计-java】springboot-vue计算机学院校友网源码（完整前后端+mysql+说明文档+LunW）.zip

机器学习-特征工程算法

吸烟数据集 991张原始图片，平均识别率在88.3% coco json格式标注

c++万能头文件picture.h

spaceX Ship Flight Test 8

大家在看

使用Arduino监控ECG和呼吸-项目开发

航空发动机缺陷检测数据集VOC+YOLO格式291张4类别.7z

python基础教程：pandas DataFrame 行列索引及值的获取的方法

【微电网优化】基于粒子群优化IEEE经典微电网结构附matlab代码.zip

三层神经网络模型matlab版

最新推荐

基于Andorid的音乐播放器项目改进版本设计.zip

uniapp-machine-learning-from-scratch-05.rar

game_patch_1.30.21.13250.pak

【毕业设计-java】springboot-vue计算机学院校友网源码（完整前后端+mysql+说明文档+LunW）.zip

机器学习-特征工程算法

Cyclone IV硬件配置详细文档解析

【WinCC与Excel集成秘籍】：轻松搭建数据交互桥梁（必读指南）

华为模拟互联地址配置

Java游戏开发简易实现与地图控制教程

【超市销售数据深度分析】：从数据库挖掘商业价值的必经之路