写一串代码按directory内excel文件数字顺序爬去所有excel第一行第三列的数据
时间: 2024-10-15 16:29:15 浏览: 31
在Python中,我们可以使用`pandas`库来读取Excel文件,并结合`os`库遍历目录内的文件。假设所有的Excel文件都在名为'directory'的目录下,且文件名与序号对应,例如`file_01.xlsx`, `file_02.xlsx`, 等等。下面是一个简单的示例代码:
```python
import os
import pandas as pd
# 定义目录路径
dir_path = 'directory'
# 获取该目录下的所有Excel文件
files = [f for f in os.listdir(dir_path) if f.endswith('.xlsx') or f.endswith('.xls')]
# 通过索引获取每个文件的第一行第三列数据
data = []
for i, file_name in enumerate(files):
# 指定文件路径
file_path = os.path.join(dir_path, file_name)
df = pd.read_excel(file_path) # 读取Excel文件
first_row_third_column = df.iloc[0, 2] # 第一行第三列的值
data.append(first_row_third_column)
# 将数据整理成列表
sorted_data = sorted(data, key=lambda x: int(x.split('_')[1])) if files else None
print("按照文件名称的数字顺序,各文件的第一行第三列数据为:", sorted_data)
阅读全文