写一串python代码按directory内excel文件数字顺序(数字在文件前)爬去所有excel第一行第三列的数据并生成列表
时间: 2024-10-17 22:05:37 浏览: 28
你可以使用Python的`os`, `pandas`, 和 `openpyxl` 库来完成这个任务。下面是一个示例代码片段,它会遍历指定目录下的Excel文件,按照文件名中的数字顺序提取每个工作簿的第一行第三列(假设名为A3的单元格),并将数据存储在一个列表中:
```python
import os
import pandas as pd
# 指定需要搜索的目录
dir_path = 'your_directory'
# 创建一个空列表来存储数据
data_list = []
# 遍历目录中的所有文件
for filename in sorted(os.listdir(dir_path), key=lambda x: int(''.join(filter(str.isdigit, x)))):
if filename.endswith('.xlsx') or filename.endswith('.xls'): # 只处理Excel文件
file_path = os.path.join(dir_path, filename)
try:
# 使用pandas读取Excel文件,并选择第一行第三列
df = pd.read_excel(file_path, sheet_name=0, header=None) # 默认Sheet1
data = df.iloc[0, 2] # 第一行第三列,索引从0开始
data_list.append(data)
except FileNotFoundError:
print(f"文件 {file_path} 未找到")
except Exception as e:
print(f"读取文件 {file_path} 出错: {str(e)}")
print("Excel文件的第一行第三列数据:")
print(data_list)
#
阅读全文