Python代码将多个个Excel表格按照地区名称对企业名称进行分类,并且新增一列是Excel名中的时间,并且按照各个地区名称生成新Excel
时间: 2024-02-13 08:01:27 浏览: 21
以下是一个可以实现您需求的 Python 代码:
``` python
import pandas as pd
import os
# 文件夹路径
folder_path = 'excel_files'
# 读取文件夹内的所有 Excel 表格数据
excel_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]
dfs = []
for file in excel_files:
# 读取 Excel 表格数据
df = pd.read_excel(file)
# 获取 Excel 文件名中的时间
time_str = os.path.basename(file).split('.')[0][-6:]
# 新增一列 Excel 文件名中的时间
df['时间'] = pd.to_datetime(time_str, format='%y%m%d')
dfs.append(df)
# 合并所有 Excel 表格数据
df = pd.concat(dfs)
# 按照地区名称分组
grouped = df.groupby('地区名称')
# 遍历每个地区分组,并保存为新的 Excel 表格
for name, group in grouped:
# 创建新的 Excel 表格文件名
file_name = name + '.xlsx'
# 将分组后的数据保存为新的 Excel 表格
group.to_excel(file_name, index=False)
```
在这个示例中,我们首先读取了一个文件夹内的所有 Excel 表格数据,并获取了 Excel 文件名中的时间。然后,我们使用 `pd.to_datetime` 函数将时间字符串转换为 Pandas 的 Datetime 对象,并新增了一列 `时间`。接着,我们使用 `pd.concat` 函数将它们合并成一个 Pandas 的 DataFrame 对象。最后,我们使用 `groupby` 函数按照地区名称对数据进行分组,并将分组后的数据保存为新的 Excel 表格。
请注意,这只是一个简单的示例代码,您需要根据实际情况进行修改和调整。另外,您需要安装 Pandas 库才能运行这个代码。