# import pandas as pd # df = pd.read_excel('sheet.xlsx', engine='openpyxl') # new_df = df.query('id == "220"') # writer = pd.ExcelWriter('new_excel_file.xlsx') # new_df.to_excel(writer, sheet_name='New_Sheet', index=False) # writer.save() import openpyxl # 读取Excel文件 workbook = openpyxl.load_workbook('sheet.xlsx') # 选择需要操作的sheet页 worksheet = workbook['Sheet'] # 根据筛选条件获取满足条件的数据,其中,min_row=2表示从第二行开始读取数据,因为第一行通常是表头; # max_row=worksheet.max_row表示读取Excel文件中所有的行数据;values_only=True表示只读取单元格中的值,而不包括格式等其他元素。 new_data = [] for row in worksheet.iter_rows(min_row=2, max_row=worksheet.max_row, values_only=True): if row[2] == '220': new_data.append(row) # 创建新的sheet页并写入数据 new_worksheet = workbook.create_sheet('New Sheet') for row in new_data: new_worksheet.append(row) # 保存Excel文件 workbook.save('sheet.xlsx')报zipfile.BadZipFile: File is not a zip file
时间: 2024-04-05 10:31:47 浏览: 238
系统级中断源-详解pandas库pd.read_excel操作读取excel文件参数整理与实例
这个错误通常是因为你的 Excel 文件已经被其他程序打开了,或者文件损坏导致的。你可以尝试先关闭 Excel 文件,然后重新运行代码,或者尝试使用另一个 Excel 文件来测试代码是否正常运行。如果问题仍然存在,你可以尝试使用 openpyxl 库提供的 load_workbook() 函数的 data_only 参数,将其设置为 True,这样可以确保仅读取单元格中的值,而不包括公式等其他元素。
阅读全文