python依次读取文件夹中所有excel第一行第一列单元格的数据并输出到新的excel中作为一列
时间: 2024-09-26 12:05:08 浏览: 37
在Python中,你可以使用pandas库来实现这个功能,因为pandas非常适合处理Excel数据。这里是一个简单的步骤说明:
1. 首先,确保已经安装了`pandas`和`openpyxl`或`xlrd`库,用于读取Excel文件。如果没有安装,可以使用pip进行安装:
```bash
pip install pandas openpyxl
```
2. 使用`os`库遍历指定文件夹中的所有Excel文件:
```python
import os
import pandas as pd
folder_path = 'your_folder_path' # 替换为你需要读取的文件夹路径
files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx') or f.endswith('.xls')]
```
3. 然后创建一个空DataFrame来保存结果,并逐个读取文件:
```python
result_df = pd.DataFrame() # 结果数据框
for file_name in files:
file_path = os.path.join(folder_path, file_name)
excel_data = pd.read_excel(file_path, engine='openpyxl' if file_name.endswith('.xlsx') else 'xlrd', header=0, sheet_name=0) # 根据.xlsx或.xls选择引擎
# 获取每张表的第一行第一列数据
first_row_first_cell = excel_data.iloc[0][0]
result_df[file_name] = first_row_first_cell # 添加到结果DataFrame中
```
4. 最后将结果数据框写入一个新的Excel文件:
```python
output_file_path = 'output.xlsx' # 输出文件路径
result_df.to_excel(output_file_path, index=False)
```
完成以上步骤后,新Excel文件`output.xlsx`就会有每张原始Excel文件的第一行第一列数据作为单独的一列。
阅读全文