用python实现提取一个文件夹所有excel表格的某一列,写入一个新excel
时间: 2023-07-07 13:06:59 浏览: 140
可以使用Python中的`pandas`库来实现这个任务。以下是一段基本的代码示例:
```python
import pandas as pd
import os
# 需要提取数据的列的名称
col_name = '列名'
# 存放源Excel文件的文件夹路径
source_folder = '源文件夹路径'
# 存放目标Excel文件的文件夹路径
target_folder = '目标文件夹路径'
# 遍历源文件夹中所有Excel文件
for filename in os.listdir(source_folder):
if filename.endswith('.xlsx') or filename.endswith('.xls'):
# 读取Excel文件
filepath = os.path.join(source_folder, filename)
df = pd.read_excel(filepath)
# 提取指定列的数据
col_data = df[col_name]
# 将数据写入新的Excel文件
target_filename = os.path.splitext(filename)[0] + '_new.xlsx'
target_filepath = os.path.join(target_folder, target_filename)
col_data.to_excel(target_filepath, index=False)
```
在这个代码示例中,我们首先指定了需要提取的列的名称和源Excel文件的文件夹路径,以及存放目标Excel文件的文件夹路径。然后,我们使用`os`模块遍历源文件夹中所有的Excel文件,读取每个文件中的数据,提取指定列的数据,并将数据写入新的Excel文件。最后,我们将新的Excel文件保存到目标文件夹中。
需要注意的是,这个代码示例假设源Excel文件中只有一个工作表,并且需要提取的列的名称在第一行。如果实际情况不同,需要根据具体情况进行修改。
阅读全文