Ubuntu遍历文件夹内所有Excel表,提取表格所有数据到一个表内
时间: 2024-12-18 22:27:50 浏览: 3
在Ubuntu系统上,你可以通过Python语言结合pandas库和openpyxl库来实现这个功能。以下是一个简单的步骤:
1. 安装必要的库:首先需要安装`python3-pandas`, `python3-openpyxl`以及`pip`(如果尚未安装)。
```bash
sudo apt-get update
sudo apt-get install python3-pandas python3-openpyxl
```
2. 使用Python脚本遍历目录并读取Excel文件:
```python
import os
import pandas as pd
# 设置你要遍历的目录
directory = '/path/to/your/directory'
# 创建一个空的数据列表来存储所有数据
all_data = []
for filename in os.listdir(directory):
if filename.endswith('.xlsx') or filename.endswith('.xls'): # 检查是否为Excel文件
file_path = os.path.join(directory, filename)
df = pd.read_excel(file_path) # 读取Excel文件
all_data.append(df)
# 合并所有数据到一个大的DataFrame中
merged_df = pd.concat(all_data, ignore_index=True) # 忽略索引以便合并
# 如果你想保存到新的Excel文件,可以这样做:
merged_df.to_excel('merged_data.xlsx', index=False) # 将结果保存到新文件
```
记得替换`'/path/to/your/directory'`为你实际要处理的Excel文件所在的路径。
阅读全文