python快速统计同一目录下多个excel文件中工作表“个人表4”的第20行第四列的数据
时间: 2024-05-09 15:15:01 浏览: 60
可以使用Python中的pandas库来处理Excel文件,代码如下:
``` python
import os
import pandas as pd
# 定义文件路径和文件名模式
file_path = '.'
file_pattern = '*.xlsx'
# 获取符合条件的文件列表
file_list = [os.path.join(file_path, file) for file in os.listdir(file_path) if file.endswith('.xlsx')]
# 定义要统计的工作表和单元格
sheet_name = '个人表4'
row_num = 19 # Excel中行号从0开始,因此第20行的行号是19
col_num = 3 # Excel中列号从0开始,因此第4列的列号是3
# 遍历文件列表,读取数据并统计
for file in file_list:
# 读取Excel文件中指定工作表的数据
data = pd.read_excel(file, sheet_name=sheet_name, header=None)
# 获取指定单元格的数据
cell_data = data.iloc[row_num, col_num]
# 输出文件名和单元格数据
print(f'{file}: {cell_data}')
```
解释一下代码:
- 第1行导入了os和pandas库。
- 第4-5行定义了要处理的文件路径和文件名模式。
- 第8行通过list comprehension获取符合条件的文件列表。
- 第11-13行定义了要统计的工作表名称、行号和列号。
- 第16-21行遍历文件列表,读取每个文件中指定工作表的数据,并获取指定单元格的数据。
- 第22行输出文件名和单元格数据。
需要注意的是,第19行的`header=None`参数是为了告诉pandas不要将Excel文件中的第一行作为列名,因为有些Excel文件可能没有列名。如果你的Excel文件中第一行是列名,可以将该参数改为`header=0`。
阅读全文