python 将目录下excel文件去除第一行合并为一个文件
时间: 2024-10-21 08:13:15 浏览: 6
要实现Python将同目录下的Excel文件(假设所有文件都有相同的结构且第一行为标题)去除后合并到一个文件中,你可以按照以下步骤操作:
1. **导入所需库**:
```python
import pandas as pd
import os
```
2. **定义文件路径**:
```python
file_path = r"D:\pythonProject\3号线断面客流数据\dataup" # 替换为你实际的文件夹路径
```
3. **获取文件列表**:
```python
excel_files = [f for f in os.listdir(file_path) if f.endswith('.xlsx')] # 获取所有Excel文件
```
4. **创建DataFrame列表来存储数据**:
```python
dfs = []
```
5. **遍历文件,读取并去除第一行**:
```python
for file in excel_files:
df_temp = pd.read_excel(os.path.join(file_path, file), header=1)
dfs.append(df_temp)
```
6. **合并所有数据框**:
```python
merged_df = pd.concat(dfs, ignore_index=True) # 合并数据,忽略索引
```
7. **以列名命名新文件**:
```python
save_name = "merged_data.xlsx"
```
8. **保存合并后的文件**:
```python
merged_df.to_excel(os.path.join(file_path, save_name), index=False) # 保存至指定路径
```
整合以上步骤得到完整的代码:
```python
import pandas as pd
import os
file_path = r"D:\pythonProject\3号线断面客流数据\dataup" # 替换为你实际的文件夹路径
excel_files = [f for f in os.listdir(file_path) if f.endswith('.xlsx')]
dfs = []
for file in excel_files:
df_temp = pd.read_excel(os.path.join(file_path, file), header=1)
dfs.append(df_temp)
merged_df = pd.concat(dfs, ignore_index=True)
save_name = "merged_data.xlsx"
merged_df.to_excel(os.path.join(file_path, save_name), index=False)
```
阅读全文