Pycharm怎么批量读取文件夹下Excel第一列中含有变动日期、公告日期、总股本的行,保留之后再转置,再加一列文件名写入Excel中
时间: 2023-11-22 10:51:53 浏览: 62
python读取excel指定列数据并写入到新的excel方法
5星 · 资源好评率100%
你可以使用pandas库来实现这个需求。下面是一个简单的示例代码:
```python
import pandas as pd
import os
# 定义要读取的文件夹路径和要匹配的关键词列表
folder_path = "/path/to/folder"
keywords = ["变动日期", "公告日期", "总股本"]
# 定义一个空的DataFrame用来存储筛选后的数据
result_df = pd.DataFrame()
# 遍历文件夹中的所有Excel文件
for filename in os.listdir(folder_path):
if filename.endswith(".xlsx"):
filepath = os.path.join(folder_path, filename)
# 读取Excel文件中的第一个sheet
df = pd.read_excel(filepath, sheet_name=0)
# 筛选出第一列中包含关键词的行
filtered_df = df[df.iloc[:, 0].str.contains("|".join(keywords))]
# 转置筛选后的数据
transposed_df = filtered_df.transpose()
# 添加一列文件名
transposed_df["文件名"] = filename
# 将结果添加到总的DataFrame中
result_df = pd.concat([result_df, transposed_df])
# 将结果保存到Excel文件中
result_df.to_excel("/path/to/output.xlsx", index=False)
```
在上面的代码中,我们首先定义了要读取的文件夹路径和要匹配的关键词列表。然后,我们遍历文件夹中的所有Excel文件,读取每个文件的第一个sheet,并筛选出第一列中包含关键词的行。接着,我们将筛选后的数据转置,并添加一列文件名。最后,我们将所有结果合并到一个总的DataFrame中,并将其保存到Excel文件中。
阅读全文