python读取佛山的excel表格内所有sheet,指定‘区’,‘省’,‘街道’,'id',‘日期’,‘数量’,'国家'列数据不删除,如果读取的数据没有指定的列内容则跳过,其它列获取最后一行第一列之后的数据,若数值低于90则删除这列数据
时间: 2024-05-14 22:11:53 浏览: 82
python读取excel数据
以下是一个可能的实现方式:
```python
import pandas as pd
# 读取Excel文件
filename = '佛山.xlsx'
df_all = pd.read_excel(filename, sheet_name=None)
# 指定需要保留的列
keep_cols = ['区', '省', '街道', 'id', '日期', '数量', '国家']
# 遍历所有sheet
for sheet_name, df in df_all.items():
# 根据需要保留的列筛选数据
df = df[keep_cols]
# 检查是否存在指定的列,如果不存在则跳过
if not all(col in df.columns for col in ['区', '省', '街道', 'id', '日期', '数量', '国家']):
continue
# 获取最后一行第一列之后的数据
last_col = df.columns[-1]
last_col_index = df.columns.get_loc(last_col)
df = df.iloc[:, last_col_index+1:]
# 删除数量低于90的列
df = df.loc[:, (df >= 90).all()]
# 输出结果
print(f"Sheet '{sheet_name}':")
print(df)
```
这段代码首先使用`pd.read_excel`读取Excel文件,然后遍历所有sheet。对于每个sheet,首先根据需要保留的列筛选数据,然后检查是否存在指定的列,如果不存在则跳过。接着获取最后一行第一列之后的数据,然后删除数量低于90的列。最后输出结果。
阅读全文