python 合并多个execl表格数据,数据从第三行开始到倒数第二行,列为全部列,然后对指定列去重
时间: 2023-06-15 12:04:59 浏览: 211
可以使用Python中的pandas库来实现合并多个Excel表格数据,并对指定列去重。
以下是一个示例代码,假设我们有三个Excel文件,分别为data1.xlsx、data2.xlsx、data3.xlsx,每个文件中数据从第三行开始到倒数第二行,列为全部列,我们要对“姓名”列进行去重:
```python
import pandas as pd
# 读取数据
df1 = pd.read_excel('data1.xlsx', header=2, skipfooter=2)
df2 = pd.read_excel('data2.xlsx', header=2, skipfooter=2)
df3 = pd.read_excel('data3.xlsx', header=2, skipfooter=2)
# 合并数据
df = pd.concat([df1, df2, df3])
# 对指定列去重
df.drop_duplicates(subset=['姓名'], inplace=True)
# 输出结果
df.to_excel('result.xlsx', index=False)
```
在上面的代码中,我们先使用pandas的read_excel函数依次读取三个Excel文件的数据,通过设置header和skipfooter参数来跳过Excel文件中的第一行和最后一行。然后,使用concat函数将三个数据框合并成一个大的数据框。最后,使用drop_duplicates函数对“姓名”列进行去重,并将结果输出到result.xlsx文件中。
需要注意的是,上面的代码只是一个示例,实际应用中还需要根据Excel文件的具体情况进行调整。
阅读全文