写一串代码让他从directory中按excel文件数字顺序从特定表格获取特定格子的数据并输出成列表
时间: 2024-10-17 14:06:02 浏览: 32
可以使用Python的pandas库来实现这个功能。假设我们有一个名为`directory`的目录,里面存放的是Excel文件,每张表都有相同的结构,我们需要从特定的表格(例如表格名为'table_name')的特定单元格(如A1)按照Excel文件的命名顺序提取数据。下面是一个例子:
```python
import os
import pandas as pd
# 定义目录路径
dir_path = 'directory'
# 定义表格名称
sheet_name = 'table_name'
# 定义需要提取的数据的单元格位置(A1形式)
cell_position = 'A1'
# 获取所有Excel文件
file_names = [f for f in os.listdir(dir_path) if f.endswith('.xlsx') or f.endswith('.xls')]
# 创建空列表存储数据
data_list = []
# 按照文件名排序(默认按照字母顺序)
file_numbers = [int(os.path.splitext(f)[0]) for f in file_names]
sorted_files = zip(file_numbers, file_names)
# 遍历文件,依次读取并提取数据
for file_num, filename in sorted_files:
full_file_path = os.path.join(dir_path, filename)
df = pd.read_excel(full_file_path, sheet_name=sheet_name) # 读取文件
data = df.loc[df.index[0], cell_position] # 提取特定单元格的数据
data_list.append(data)
print("提取的数据列表:", data_list)
```
这段代码会将Excel文件中的数据按照文件名的数字顺序逐一读取,并将'A1'位置的数据添加到`data_list`中。
阅读全文