使用Python打开多个文档,每个文档中都有一列'TIME',将文档内容按照'TIME'进行命名,输出多个文档
时间: 2024-10-22 16:15:07 浏览: 10
在Python中,你可以使用pandas库来处理这种场景。首先,确保已经安装了pandas和openpyxl(如果读取的是Excel文件),如果没有可以使用`pip install pandas openpyxl`命令安装。
以下是处理多个Excel文档并按'TIME'列命名的基本步骤:
```python
import os
import pandas as pd
# 定义源目录和目标文件夹
source_folder = 'your_source_folder_path'
output_folder = 'your_output_folder_path'
# 检查目标文件夹是否存在,不存在则创建
if not os.path.exists(output_folder):
os.makedirs(output_folder)
# 遍历源文件夹中的所有xlsx文件
for filename in os.listdir(source_folder):
if filename.endswith('.xlsx'): # 只考虑.xlsx文件
file_path = os.path.join(source_folder, filename)
# 加载Excel文件
df = pd.read_excel(file_path)
# 确保存在'TIME'列,如果不是,则跳过该文件
if 'TIME' not in df.columns:
print(f"Skipped {filename}: 'TIME' column not found.")
continue
# 提取'TIME'列作为新文件名
time_column = df['TIME'].iloc[0] # 假设只有一个'TIME'值
# 创建新的输出文件路径
output_file_path = os.path.join(output_folder, f"{time_column}.csv")
# 将数据框保存到CSV文件
df.to_csv(output_file_path, index=False)
print(f"Saved '{filename}' as '{time_column}.csv'.")
阅读全文