python html多个table转到excel或csv文件中,并将单元格按单元格内容最大调整宽度,若单元格内容为float型,转换成字符串后计算长度
时间: 2024-03-03 16:49:30 浏览: 118
可以使用Python中的`pandas`库来将多个HTML表格转换为Excel或CSV文件,同时使用`openpyxl`和`xlsxwriter`库来设置Excel文件中的列宽。
以下是一个示例代码,可以实现将多个HTML表格转换为一个Excel文件,并根据最大单元格内容长度自动设置Excel文件中的列宽:
```python
import pandas as pd
from openpyxl.utils import get_column_letter
from openpyxl import Workbook
import xlsxwriter
# 读取HTML文件中的所有表格
tables = pd.read_html('input.html')
# 创建Excel文件
workbook = Workbook()
writer = pd.ExcelWriter('output.xlsx', engine='xlsxwriter')
# 遍历表格并写入到Excel文件中
for i, table in enumerate(tables):
# 将表格写入到Excel文件的对应Sheet中
table.to_excel(writer, sheet_name=f'Sheet{i+1}', index=False)
# 设置Excel文件中的列宽
worksheet = writer.sheets[f'Sheet{i+1}']
for j, width in enumerate(table.applymap(lambda x: len(str(x)) if isinstance(x, float) else len(x)).max().values):
worksheet.set_column(j, j, max(width+1, len(get_column_letter(j+1))))
# 保存Excel文件
writer.save()
```
这个代码片段首先使用`pandas`库的`read_html`函数从HTML文件中读取所有表格,并将它们保存在一个列表中。然后,它使用`openpyxl`库创建一个新的Excel文件,并使用`pandas`库的`to_excel`函数将每个表格写入Excel文件中的不同Sheet中。
接下来,它使用`xlsxwriter`库设置Excel文件中的列宽。对于每个表格,它首先使用`applymap`函数将每个单元格中的内容转换为字符串,并计算出该列中最大的字符串长度(如果单元格内容为float型,则先将其转换成字符串再计算长度)。然后,它使用`set_column`方法将列宽设置为该长度加上1,为了保证单元格内容完全显示。如果列宽小于列名的长度,则将列宽设置为列名的长度。
最后,它使用`writer.save()`函数将Excel文件保存到磁盘中。
阅读全文