Python 遍历文件夹EXCEL文件 并按第1列前9位字符拆分表 之后删除表的前2列 并去重 保留原表字体和格式
时间: 2024-03-15 13:44:15 浏览: 65
VBA 按照某一列进行筛选拆分数据,拆分成多个表或多个Sheet,按某列检查重复生成新的Sheet,删除除本表外的所有表
5星 · 资源好评率100%
好的,我来给您提供一下实现的思路。
首先,您需要用 Python 中的 `os` 模块来遍历所需的文件夹,找到所有的 Excel 文件。然后,使用 `pandas` 模块来读取 Excel 文件并进行数据处理。
具体的实现步骤如下:
1. 导入所需模块
```python
import os
import pandas as pd
```
2. 遍历文件夹中的 Excel 文件
```python
# 定义文件夹路径
folder_path = "/path/to/folder"
# 遍历文件夹中的所有文件
for root, dirs, files in os.walk(folder_path):
for file in files:
# 判断文件是否为 Excel 文件
if file.endswith(".xlsx") or file.endswith(".xls"):
# 处理 Excel 文件
file_path = os.path.join(root, file)
# 读取 Excel 文件
df = pd.read_excel(file_path, header=None)
# 进行数据处理
# ...
```
3. 拆分表并删除前两列
```python
# 按第1列前9位字符拆分表,并删除前两列
grouped = df.groupby(df[0].astype(str).str[:9])
for name, group in grouped:
# 删除前两列
group = group.iloc[:, 2:]
# 保存拆分后的表
# ...
```
4. 去重并保留原表字体和格式
```python
# 去重并保留原表字体和格式
grouped = group.drop_duplicates()
# 保存拆分后的表(包括字体和格式)
# ...
```
综上所述,您可以按照以上步骤实现您的需求。当然,具体的实现细节还需要您根据实际情况进行调整。
阅读全文