用python提取文件夹中所有excel表格的某一列,并生成一个新的excel表,将所有数据写入新的excel
时间: 2024-01-22 21:20:23 浏览: 79
可以使用Python的pandas库来实现这个功能。以下是示例代码:
``` python
import os
import pandas as pd
# 设置要读取的文件夹路径和要提取的列名
folder_path = '/path/to/folder'
column_name = 'column_name'
# 获取文件夹中所有excel文件的路径
file_paths = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# 读取每个excel文件中指定列的数据并合并到一个DataFrame中
data = pd.DataFrame()
for file_path in file_paths:
df = pd.read_excel(file_path, usecols=[column_name])
data = pd.concat([data, df], ignore_index=True)
# 将数据写入新的excel文件
output_file_path = '/path/to/output.xlsx'
data.to_excel(output_file_path, index=False)
```
在代码中,首先需要设置要读取的文件夹路径和要提取的列名。然后使用`os.listdir`函数获取文件夹中所有excel文件的路径,并使用`pd.read_excel`函数读取每个文件中指定列的数据。将读取的数据使用`pd.concat`函数合并到一个DataFrame中,最后使用`pd.DataFrame.to_excel`函数将数据写入新的excel文件中。
阅读全文