Python代码将多个个Excel表格按照地区名称对企业名称进行分类
时间: 2024-02-13 15:01:21 浏览: 141
内容的路线图-python对excel按列值筛选并拆分表格到多个文件的代码
您可以使用Python中的pandas库来读取和处理多个Excel表格数据,再结合groupby函数实现按照地区名称对企业名称进行分类。
以下是一个简单的示例代码:
``` python
import pandas as pd
import os
# 文件夹路径
folder_path = 'excel_files'
# 读取文件夹内的所有Excel表格数据
excel_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]
dfs = [pd.read_excel(f) for f in excel_files]
# 合并所有Excel表格数据
df = pd.concat(dfs)
# 按照地区名称分组
grouped = df.groupby('地区名称')
# 遍历每个地区分组
for name, group in grouped:
print('地区名称:', name)
print('企业名称:', list(group['企业名称']))
```
在这个示例中,我们首先读取了一个文件夹内的所有Excel表格数据,并使用pd.concat函数将它们合并成一个pandas的DataFrame对象。然后,我们使用groupby函数按照地区名称对数据进行分组。最后,我们遍历每个地区分组,输出企业名称列表。
请注意,这只是一个简单的示例代码,您需要根据实际情况进行修改和调整。另外,您需要安装pandas库才能运行这个代码。
阅读全文