遍历文件夹,读取EXCEL文件,并按第1例前9位字符 拆分表
时间: 2024-03-13 15:42:56 浏览: 82
好的,我明白了。针对你的问题,我可以提供如下的解决方案:
首先,你需要使用 Python 中的 `os` 模块来遍历指定文件夹中的所有文件,然后使用 `pandas` 模块中的 `read_excel()` 函数来读取 Excel 文件。接着,可以使用 `pandas` 模块中的 `groupby()` 函数来按照第1列前9位字符进行拆分表。
具体的代码实现如下:
```python
import os
import pandas as pd
# 指定文件夹路径和 Excel 文件扩展名
folder_path = "your/folder/path"
extension = ".xlsx"
# 遍历文件夹中的所有文件,并读取 Excel 文件
for file in os.listdir(folder_path):
if file.endswith(extension):
file_path = os.path.join(folder_path, file)
df = pd.read_excel(file_path)
# 拆分表
groups = df.groupby(df.iloc[:, 0].astype(str).str[:9])
for name, group in groups:
# 处理拆分后的表
print(name)
print(group)
```
其中,`df.iloc[:, 0]` 表示选取第1列数据,`.astype(str)` 表示将数据转换为字符串类型,`.str[:9]` 表示截取字符串的前9个字符。
注意,上述代码中只是简单地打印出了拆分后的表名和表内容,你需要根据实际需求来进行后续的处理。
阅读全文