openpyxl.load_workbook与pd.read_excel区别
时间: 2024-04-08 21:15:10 浏览: 174
openpyxl.load_workbook是Python中用于加载Excel文件的函数,可以读取Excel文件中的数据并实现简单的操作。而pd.read_excel是Pandas模块中的函数,它也可以读取Excel文件中的数据,但更多地用于将数据转换为数据框。此外,pd.read_excel还可以在读取时进行数据清洗和转换。
相关问题
wb1 = openpyxl.load_workbook(source_file) ws1 = wb1.active wb2 = openpyxl.load_workbook(target_file) wb2_oldsheetname = wb2.sheetnames target_ws_name = 'sd' + source_file[-6] wb2.active.title = target_ws_name ws2 = wb2.active python修改sheet名后为target_ws_name,使用pandas如何更新表格里包含图表的引用数据源中数据系列涉及到的sheet名,更新并输出代码
可以使用 Pandas 中的 `read_excel` 方法读取表格,然后使用 `to_excel` 方法输出修改后的表格。在 `read_excel` 方法中,可以通过 `sheet_name` 参数指定要读取的工作表名称。在 `to_excel` 方法中,可以通过 `sheet_name` 参数指定要输出的工作表名称。
为了更新包含图表的引用数据源中的数据系列涉及到的工作表名称,可以使用正则表达式和字符串替换来完成。具体操作步骤如下:
1. 读取表格文件到 Pandas DataFrame 中。
```
import pandas as pd
df = pd.read_excel(target_file, sheet_name=target_ws_name, engine='openpyxl')
```
2. 使用正则表达式和字符串替换来更新数据系列涉及到的工作表名称。
```
import re
old_sheetname_pattern = re.compile('|'.join(wb2_oldsheetname))
new_sheetname = target_ws_name
for col in df.columns:
for i, cell_value in enumerate(df[col]):
if isinstance(cell_value, str) and old_sheetname_pattern.search(cell_value):
df.at[i, col] = old_sheetname_pattern.sub(new_sheetname, cell_value)
```
3. 将更新后的 DataFrame 输出到表格文件中。
```
df.to_excel(target_file, sheet_name=target_ws_name, index=False)
```
完整代码如下:
```
import pandas as pd
import re
import openpyxl
wb1 = openpyxl.load_workbook(source_file)
ws1 = wb1.active
wb2 = openpyxl.load_workbook(target_file)
wb2_oldsheetname = wb2.sheetnames
target_ws_name = 'sd' + source_file[-6]
wb2.active.title = target_ws_name
ws2 = wb2.active
# 读取表格文件到 Pandas DataFrame 中
df = pd.read_excel(target_file, sheet_name=target_ws_name, engine='openpyxl')
# 使用正则表达式和字符串替换来更新数据系列涉及到的工作表名称
old_sheetname_pattern = re.compile('|'.join(wb2_oldsheetname))
new_sheetname = target_ws_name
for col in df.columns:
for i, cell_value in enumerate(df[col]):
if isinstance(cell_value, str) and old_sheetname_pattern.search(cell_value):
df.at[i, col] = old_sheetname_pattern.sub(new_sheetname, cell_value)
# 将更新后的 DataFrame 输出到表格文件中
df.to_excel(target_file, sheet_name=target_ws_name, index=False)
```
#!/bin/env python import numpy as np import pandas as pd import openpyxl,os df_csv = pd.read_csv(r'Permance_a.csv',index_col=0,encoding='utf-8') df_csv.to_excel(r'Permance_a.xlsx') # 打开Excel文件 wb = openpyxl.load_workbook('Permance_a.xlsx') # 选择第一个工作表 ws = wb.active # 循环遍历每一个单元格 for row in ws.iter_rows(): for cell in row: # 判断单元格是否包含% if '%' in str(cell.value): # 将单元格格式设置为数字格式 cell.number_format = '0.00%' # 将单元格值除以100并重新赋值给单元格 cell.value = float(cell.value.strip('%')) / 100 # 保存Excel文件 wb.save('Permance_a.xlsx') # 源表格和目标表格的文件名 source_file = r'Permance_a.xlsx' target_file = r'Permance.xlsx' source_end_col = 8 # 结束列 source_start_col = 5 # 开始列 source_start_row = [2,12,22,32] source_end_row = [11,21,31,41] target_end_col = 6 # 结束列 target_start_col = 3 # 开始列 target_start_row = [7,35,21,49] target_end_row = [16,44,30,58] # 打开两个工作簿 wb1 = openpyxl.load_workbook(source_file) ws1 = wb1.active target_ws_name = 'sd' + source_file[-6] wb2 = openpyxl.load_workbook(target_file) wb2.active.title = target_ws_name ws2 = wb2.active # 将源表格的数据覆盖到目标表格中 for i in range(len(source_start_row)): for row in range(source_start_row[i], source_end_row[i]+1): for col in range(source_start_col, source_end_col+1): value = ws1.cell(row=row, column=col).value ws2.cell(row=target_start_row[i]+row-source_start_row[i], column=target_start_col+col-source_start_col, value=value) # 保存目标表格 wb2.save(target_file) 修改以上代码,将目标文件中数据引用源中工作明修改为target_ws_name
修改后的代码如下:
```
#!/bin/env python
import numpy as np
import pandas as pd
import openpyxl,os
df_csv = pd.read_csv(r'Permance_a.csv',index_col=0,encoding='utf-8')
df_csv.to_excel(r'Permance_a.xlsx')
# 打开Excel文件
wb = openpyxl.load_workbook('Permance_a.xlsx')
# 选择第一个工作表
ws = wb.active
# 循环遍历每一个单元格
for row in ws.iter_rows():
for cell in row:
# 判断单元格是否包含%
if '%' in str(cell.value):
# 将单元格格式设置为数字格式
cell.number_format = '0.00%'
# 将单元格值除以100并重新赋值给单元格
cell.value = float(cell.value.strip('%')) / 100
# 保存Excel文件
wb.save('Permance_a.xlsx')
# 源表格和目标表格的文件名
source_file = r'Permance_a.xlsx'
target_file = r'Permance.xlsx'
source_end_col = 8 # 结束列
source_start_col = 5 # 开始列
source_start_row = [2,12,22,32]
source_end_row = [11,21,31,41]
target_end_col = 6 # 结束列
target_start_col = 3 # 开始列
target_start_row = [7,35,21,49]
target_end_row = [16,44,30,58]
# 打开两个工作簿
wb1 = openpyxl.load_workbook(source_file)
ws1 = wb1.active
# 修改目标工作表名
target_ws_name = 'sd' + source_file[-6]
wb2 = openpyxl.load_workbook(target_file)
wb2[target_ws_name].title = target_ws_name
ws2 = wb2[target_ws_name]
# 将源表格的数据覆盖到目标表格中
for i in range(len(source_start_row)):
for row in range(source_start_row[i], source_end_row[i]+1):
for col in range(source_start_col, source_end_col+1):
value = ws1.cell(row=row, column=col).value
ws2.cell(row=target_start_row[i]+row-source_start_row[i], column=target_start_col+col-source_start_col, value=value)
# 保存目标表格
wb2.save(target_file)
```
阅读全文