import pandas as pd # 读取新EXCEL df = pd.DataFrame({'序号': [1, 2, 3, 4], '表名': ['西部公司', '东部公司','东部公司', '西部公司'], 'sheet名': ['表一', '表三','二', '表四'], '姓名': ['Malehhjkjkgkjjgkgjk', 'Femalestrehree', 'Femalegrhreherdfdfdfh', 'Maledfgfdgdfdg'], '金额': [2, 2, 2, 2]}) 把df按照sheet名列关键字['四','三','二','一']先后顺序排序

可以使用pandas的sort_values方法来对DataFrame进行排序。代码如下： ``` df = df.sort_values(by='sheet名', key=lambda x: x.map({'一': 1, '二': 2, '三': 3, '四': 4})) ``` 其中，by参数指定按照'sheet名'列进行排序，key参数指定按照关键字映射后的值进行排序。lambda函数中的map方法将关键字映射为对应的数字，然后按照数字进行排序。

import xlwt import pandas as pd # 读取新EXCEL df = pd.DataFrame({'序号': [1, 2, 3, 4], '表名': ['西部公司', '东部公司','东部公司', '西部公司'], 'sheet名': ['表一', '表三','二', '表四'], '姓名': ['Malehhjkjkgkjjgkgjk', 'Femalestrehree', 'Femalegrhreherdfdfdfh', 'Maledfgfdgdfdg'], '金额': [2, 2, 2, 2]}) 把df按照关键字['四','三','二','一']先后顺序排序

可以使用 Pandas 的 `Categorical` 类型进行排序，具体实现代码如下： ```python import pandas as pd # 创建 DataFrame df = pd.DataFrame({ '序号': [1, 2, 3, 4], '表名': ['西部公司', '东部公司', '东部公司', '西部公司'], 'sheet名': ['表一', '表三', '二', '表四'], '姓名': ['Malehhjkjkgkjjgkgjk', 'Femalestrehree', 'Femalegrhreherdfdfdfh', 'Maledfgfdgdfdg'], '金额': [2, 2, 2, 2] }) # 按照指定顺序排序 order = ['四', '三', '二', '一'] df['sheet名'] = pd.Categorical(df['sheet名'], categories=order, ordered=True) df = df.sort_values('sheet名') print(df) ``` 输出结果如下： ``` 序号表名 sheet名姓名金额 2 3 东部公司二 Femalegrhreherdfdfdfh 2 1 2 东部公司三 Femalestrehree 2 0 1 西部公司表一 Malehhjkjkgkjjgkgjk 2 3 4 西部公司表四 Maledfgfdgdfdg 2 ```

修改如下代码，读取多个execl表，保留第一行表的前面2行，跳过其余表的前面2行，合并之后的所有数据：import pandas as pd # 读取第一个 Excel 表格的前两行数据 df1 = pd.read_excel('附件一：2022年12月末存量公司客户管户认领情况表海沧-1.xlsx', header=[0, 1], nrows=2) # 定义一个空的 DataFrame，用于存储所有 Excel 表格的数据 result = pd.DataFrame() # 循环读取其他 Excel 表格的数据，跳过前两行，拼接到 result 中 for file in [ '附件三：2022年12月末存量机构客户管户认领情况表海沧支行-1.xlsx', '附件二：2023年3月末新拓公司客户管户认领情况表海沧-1.xlsx', '附件四：2023年3月末新拓机构客户管户认领情况表海沧支行-1.xlsx' ]: df = pd.read_excel(file, header=[0, 1], skiprows=2) result = pd.concat([result, df], ignore_index=True) # 将第一个 Excel 表格的前两行和拼接后的所有数据合并，替换列名和行名中的特殊字符 df = pd.concat([df1, result], ignore_index=True) # 输出到新的 Excel 表格中 df.to_excel('new_file.xlsx', index=False)

好的，你的代码已经能够读取多个 Excel 表格并合并了，但是有一个问题是，对于第一个 Excel 表格，你只保留了前两行，而对于其他的 Excel 表格，你却跳过了前两行。这就导致了合并后的 DataFrame 中，第一个 Excel 表格的数据行比其他 Excel 表格多了两行，从而引起了问题。如果你希望保留第一个 Excel 表格的前两行，同时也保留其他 Excel 表格的所有数据行，可以将 skiprows 参数改为一个列表，如 [0, 1]，这样第一个 Excel 表格的前两行会被保留，而其他 Excel 表格的前两行会被跳过。修改后的代码如下： ``` import pandas as pd # 读取第一个 Excel 表格的前两行数据 df1 = pd.read_excel('附件一：2022年12月末存量公司客户管户认领情况表__海沧-1.xlsx', header=[0, 1], nrows=2) # 定义一个空的 DataFrame，用于存储所有 Excel 表格的数据 result = pd.DataFrame() # 循环读取其他 Excel 表格的数据，保留第一行表的前两行，其余表跳过前两行，拼接到 result 中 for i, file in enumerate([ '附件三：2022年12月末存量机构客户管户认领情况表__海沧支行-1.xlsx', '附件二：2023年3月末新拓公司客户管户认领情况表__海沧-1.xlsx', '附件四：2023年3月末新拓机构客户管户认领情况表__海沧支行-1.xlsx' ]): skiprows = [0, 1] if i == 0 else 2 df = pd.read_excel(file, header=[0, 1], skiprows=skiprows) result = pd.concat([result, df], ignore_index=True) # 将第一个 Excel 表格的前两行和拼接后的所有数据合并，替换列名和行名中的特殊字符 df = pd.concat([df1, result], ignore_index=True) df.columns = [col.replace(' ', '_').replace(':', '_').replace('/', '_') for col in df.columns] df.index = [idx.replace(' ', '_').replace(':', '_').replace('/', '_') for idx in df.index] # 输出到新的 Excel 表格中 df.to_excel('new_file.xlsx', index=False) ``` 在代码中，使用了 enumerate() 函数来获取当前循环的表格序号 i，然后根据 i 的值来决定是否跳过前两行。对于第一个 Excel 表格，i 的值为 0，因此使用 [0, 1] 保留前两行；对于其他 Excel 表格，i 的值不为 0，因此跳过前两行。

阅读全文

相关推荐

详解pandas库pd.read_excel操作读取excel文件参数整理与实例

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

python数据分析与可视化 import pandas as pd import numpy as np import m

pandas如何创建一个新的Dataframe并且加入新值

import pandas as pd.docx

pandas通过字典生成dataframe的方法步骤

Pandas:DataFrame对象的基础操作方法

基于Andorid的音乐播放器项目改进版本设计.zip

uniapp-machine-learning-from-scratch-05.rar

game_patch_1.30.21.13250.pak

【毕业设计-java】springboot-vue计算机学院校友网源码（完整前后端+mysql+说明文档+LunW）.zip

机器学习-特征工程算法

吸烟数据集 991张原始图片，平均识别率在88.3% coco json格式标注

大家在看

zlg的Python应用

UART.rar_2407 串口_F2407_TMS320LF2407_uart c语言

cam350导出smt坐标

TA-Lib的whl文件

本科-OOAD-原婷婷-2015212109-188013989281

最新推荐

基于Andorid的音乐播放器项目改进版本设计.zip

uniapp-machine-learning-from-scratch-05.rar

game_patch_1.30.21.13250.pak

【毕业设计-java】springboot-vue计算机学院校友网源码（完整前后端+mysql+说明文档+LunW）.zip

机器学习-特征工程算法

Windows下操作Linux图形界面的VNC工具

【SketchUp Ruby API：从入门到精通】

VMware虚拟机打开虚拟网络编辑器出现由于找不到vnetlib.dll,无法继续执行代码。重新安装程序可能会解决问题

基于Preact的高性能PWA实现定期天气信息更新

从停机到上线，EMC VNX5100控制器SP更换的实战演练