Python代码将多个个Excel表格按照地区名称对企业名称进行分类,并且新增一列是Excel名的一部分
时间: 2024-02-13 08:01:22 浏览: 107
以下是一个可以实现您需求的 Python 代码:
``` python
import pandas as pd
import os
# 文件夹路径
folder_path = 'excel_files'
# 读取文件夹内的所有 Excel 表格数据
excel_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]
dfs = []
for file in excel_files:
# 读取 Excel 表格数据
df = pd.read_excel(file)
# 新增一列 Excel 文件名的一部分
df['文件名'] = os.path.basename(file).split('.')[0]
dfs.append(df)
# 合并所有 Excel 表格数据
df = pd.concat(dfs)
# 按照地区名称分组
grouped = df.groupby('地区名称')
# 遍历每个地区分组
for name, group in grouped:
print('地区名称:', name)
print('企业名称:', list(group['企业名称']))
print('文件名:', list(group['文件名']))
```
在这个示例中,我们首先读取了一个文件夹内的所有 Excel 表格数据,并新增了一列 `文件名`,该列是 Excel 文件名的一部分。然后,我们使用 `pd.concat` 函数将它们合并成一个 Pandas 的 DataFrame 对象。最后,我们使用 `groupby` 函数按照地区名称对数据进行分组,并输出企业名称列表和文件名列表。
请注意,这只是一个简单的示例代码,您需要根据实际情况进行修改和调整。另外,您需要安装 Pandas 库才能运行这个代码。
阅读全文