Pycharm怎么批量读取文件夹下Excel第一列中含有变动日期、公告日期、总股本的行,保留之后再合并转置写入Excel中
时间: 2023-11-22 11:52:10 浏览: 86
可以使用pandas库来实现批量读取文件夹下的Excel文件、筛选含有特定内容的行、合并、转置和写入Excel。以下是示例代码:
```python
import os
import pandas as pd
# 设置输入文件夹路径和输出文件路径
input_folder = 'input_folder_path'
output_file = 'output_file_path'
# 定义函数,用于读取Excel文件并筛选需要的行
def read_excel(file_path):
# 读取Excel文件
df = pd.read_excel(file_path)
# 筛选含有变动日期、公告日期、总股本的行
df = df[df['列名'].isin(['变动日期', '公告日期', '总股本'])]
return df
# 定义函数,用于批量读取文件夹下的Excel文件并合并
def merge_excel(input_folder):
# 获取文件夹下所有Excel文件路径
file_paths = [os.path.join(input_folder, file) for file in os.listdir(input_folder) if file.endswith('.xlsx')]
# 读取所有Excel文件并合并
dfs = [read_excel(file_path) for file_path in file_paths]
merged_df = pd.concat(dfs)
return merged_df
# 调用函数,批量读取文件夹下的Excel文件并合并
merged_df = merge_excel(input_folder)
# 转置数据
transposed_df = merged_df.T
# 写入Excel文件
transposed_df.to_excel(output_file, index=False)
```
需要注意的是,上述代码中的列名需要替换为实际的列名。另外,由于输入文件夹中可能存在非Excel文件,因此可以添加判断文件扩展名的条件来避免读取非Excel文件。
阅读全文