python实现读取多个excel中指定列汇总到一个excel
时间: 2023-08-22 14:05:54 浏览: 255
你可以使用 `pandas` 库来实现读取多个 Excel 文件中的指定列并汇总到一个 Excel 文件中。以下是实现的步骤:
1. 导入 `pandas` 库。
``` python
import pandas as pd
```
2. 创建一个空的 DataFrame。
``` python
df_all = pd.DataFrame()
```
3. 循环读取多个 Excel 文件中的指定列。
``` python
for file_name in ['file1.xlsx', 'file2.xlsx', 'file3.xlsx']:
# 读取 Excel 文件
df = pd.read_excel(file_name, usecols=['列名1', '列名2'])
# 将当前读取的 Excel 文件的数据添加到 df_all 中
df_all = pd.concat([df_all, df], ignore_index=True)
```
在循环中,我们首先使用 `pd.read_excel` 函数读取指定的列,然后使用 `pd.concat` 函数将当前读取的 Excel 文件的数据添加到 `df_all` 中。
4. 将汇总后的数据保存到一个新的 Excel 文件中。
``` python
df_all.to_excel('output.xlsx', index=False)
```
这将把 `df_all` 中的数据保存到一个名为 `output.xlsx` 的新 Excel 文件中。`index=False` 参数表示不将行索引保存到 Excel 文件中。
完整的代码如下:
``` python
import pandas as pd
# 创建一个空的 DataFrame
df_all = pd.DataFrame()
# 读取多个 Excel 文件中的指定列并汇总到一个 DataFrame 中
for file_name in ['file1.xlsx', 'file2.xlsx', 'file3.xlsx']:
# 读取 Excel 文件
df = pd.read_excel(file_name, usecols=['列名1', '列名2'])
# 将当前读取的 Excel 文件的数据添加到 df_all 中
df_all = pd.concat([df_all, df], ignore_index=True)
# 将汇总后的数据保存到一个新的 Excel 文件中
df_all.to_excel('output.xlsx', index=False)
```
你只需要将代码中的 `'file1.xlsx'`、`'file2.xlsx'` 和 `'file3.xlsx'` 替换为你要读取的 Excel 文件名,`'列名1'` 和 `'列名2'` 替换为你要读取的列名即可。
阅读全文