python读取多个excel文件某一列合并
时间: 2023-07-11 17:03:40 浏览: 221
可以使用 Pandas 库来读取多个 Excel 文件,并将某一列合并。
具体步骤如下:
1. 导入 Pandas 库。
```python
import pandas as pd
```
2. 定义一个空的 DataFrame。
```python
df = pd.DataFrame()
```
3. 遍历多个 Excel 文件,将每个文件中需要的列读取到 DataFrame 中。
```python
for file_name in ['file1.xlsx', 'file2.xlsx', 'file3.xlsx']:
# 读取 Excel 文件中的指定列
data = pd.read_excel(file_name, usecols=['column_name'])
# 将数据添加到 DataFrame 中
df = pd.concat([df, data], ignore_index=True)
```
其中,`usecols` 参数用于指定需要读取的列,可以是列名或列索引。`concat` 函数用于将多个 DataFrame 合并成一个,`ignore_index` 参数用于重置索引。
4. 对 DataFrame 进行处理,例如去重、排序等。
```python
# 去重
df = df.drop_duplicates()
# 排序
df = df.sort_values('column_name')
```
最终得到的 DataFrame 中,`column_name` 列包含了多个 Excel 文件中指定的列的数据。
阅读全文