写一串python代码按directory内excel文件数字顺序爬去所有excel第一行第三列的数据

首先，你需要安装pandas库，因为它提供了读取Excel文件的功能。你可以使用`pip install pandas`来安装。下面是一段Python代码，它会按照目录中Excel文件的名称排序，并获取每个文件的第一行第三列数据： ```python import os import pandas as pd # 定义要搜索的目录 directory = '/path/to/your/directory' # 按照Excel文件名（假设它们都是'.xlsx'或'.xls'格式）获取文件列表并排序 file_list = sorted(os.listdir(directory), key=lambda x: int(x.split('.')[0])) data = [] for file in file_list: if file.endswith(('.xlsx', '.xls')): # 读取每份Excel文件，获取第一行第三列（假设索引从0开始） df = pd.read_excel(os.path.join(directory, file)) data.append(df.iloc[0, 2]) # 将结果存储在一个列表中 sorted_data = [str(item) for item in data] # 如果数据是数值，这里需要转为字符串 print(sorted_data) ``` 请注意替换`'/path/to/your/directory'`为实际的文件夹路径。如果文件中的数据不是数字，可能需要进一步处理以便适配。

阅读全文

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通