写一串代码按directory内excel文件顺序爬去所有excel第一行第三列的数据
时间: 2024-10-15 11:29:16 浏览: 31
如果你想要编写Python代码来读取特定目录下Excel文件的第一行第三列数据,并且按照文件名称的顺序,你可以使用pandas库配合openpyxl或xlrd库来实现。这里我们假设所有的Excel文件都是.xlsx格式的,且它们的第一行都有第三列。
首先安装所需的库,如果还没有安装,可以在命令行运行:
```bash
pip install pandas openpyxl
```
然后你可以尝试以下代码:
```python
import os
import pandas as pd
# 定义目录路径
dir_path = 'your_excel_directory'
# 创建一个空列表来存储数据
data_list = []
# 遍历目录中的每个文件
for filename in sorted(os.listdir(dir_path)):
if filename.endswith('.xlsx'):
# 文件完整路径
file_path = os.path.join(dir_path, filename)
# 使用openpyxl读取Excel文件
df = pd.read_excel(file_path, engine='openpyxl', sheet_name=0) # 假设所有文件都在第一个工作表
# 提取第一行第三列的数据
first_row_third_column = df.iloc[0, 2] # 第一行索引是0,第三列索引是2(因为Python的索引是从0开始的)
data_list.append(first_row_third_column)
# 将数据转换为DataFrame并打印结果
data_df = pd.DataFrame(data_list, columns=['Data'])
print(data_df)
#
阅读全文