python html多个table转到excel或csv文件中,并将单元格按最宽文本调整宽度
时间: 2024-03-03 21:49:08 浏览: 189
您可以使用Python的pandas库来将HTML中的多个表格转换为Excel或CSV文件,并自动调整单元格的宽度以适应最宽的文本。下面是一个示例代码:
```python
import pandas as pd
# 从HTML文件中读取表格数据
tables = pd.read_html('example.html')
# 将每个表格写入单独的工作表
writer = pd.ExcelWriter('output.xlsx', engine='xlsxwriter')
for i, table in enumerate(tables):
table.to_excel(writer, sheet_name=f'Table {i+1}')
# 自动调整单元格宽度以适应最宽的文本
worksheet = writer.sheets[f'Table {i+1}']
for j, width in enumerate(table.applymap(len).max().values):
worksheet.set_column(j, j, width+1)
writer.save()
```
这段代码将HTML文件中的所有表格读取到一个列表中,然后使用pandas的to_excel方法将它们写入单独的工作表。在写入每个工作表之后,使用xlsxwriter库自动调整每个列的宽度以适应最宽的文本。最后将结果保存为Excel文件。您也可以将输出文件格式更改为CSV,只需更改engine参数即可。
相关问题
python html多个table转到excel或csv文件中,并将单元格按单元格内容最大调整宽度,若单元格内容为float型,转换成字符串后计算长度
可以使用Python中的`pandas`库来将多个HTML表格转换为Excel或CSV文件,同时使用`openpyxl`和`xlsxwriter`库来设置Excel文件中的列宽。
以下是一个示例代码,可以实现将多个HTML表格转换为一个Excel文件,并根据最大单元格内容长度自动设置Excel文件中的列宽:
```python
import pandas as pd
from openpyxl.utils import get_column_letter
from openpyxl import Workbook
import xlsxwriter
# 读取HTML文件中的所有表格
tables = pd.read_html('input.html')
# 创建Excel文件
workbook = Workbook()
writer = pd.ExcelWriter('output.xlsx', engine='xlsxwriter')
# 遍历表格并写入到Excel文件中
for i, table in enumerate(tables):
# 将表格写入到Excel文件的对应Sheet中
table.to_excel(writer, sheet_name=f'Sheet{i+1}', index=False)
# 设置Excel文件中的列宽
worksheet = writer.sheets[f'Sheet{i+1}']
for j, width in enumerate(table.applymap(lambda x: len(str(x)) if isinstance(x, float) else len(x)).max().values):
worksheet.set_column(j, j, max(width+1, len(get_column_letter(j+1))))
# 保存Excel文件
writer.save()
```
这个代码片段首先使用`pandas`库的`read_html`函数从HTML文件中读取所有表格,并将它们保存在一个列表中。然后,它使用`openpyxl`库创建一个新的Excel文件,并使用`pandas`库的`to_excel`函数将每个表格写入Excel文件中的不同Sheet中。
接下来,它使用`xlsxwriter`库设置Excel文件中的列宽。对于每个表格,它首先使用`applymap`函数将每个单元格中的内容转换为字符串,并计算出该列中最大的字符串长度(如果单元格内容为float型,则先将其转换成字符串再计算长度)。然后,它使用`set_column`方法将列宽设置为该长度加上1,为了保证单元格内容完全显示。如果列宽小于列名的长度,则将列宽设置为列名的长度。
最后,它使用`writer.save()`函数将Excel文件保存到磁盘中。
python fastapi 上传一个excel文件,在html上显示,单元格内容可以修改,并点击保存重新保存到excel文件
在Python FastAPI项目中,结合HTML模板和文件处理功能,你可以创建一个web应用来实现用户上传Excel文件并在前端展示,允许用户编辑内容并保存回原文件。这里是一个简化的步骤概述:
1. **安装必要的库**:
首先,你需要安装`FastAPI`, `Uvicorn`, `starlette.requests`, `Pandas`(用于读取和操作Excel),以及前端框架如`Jinja2`(用于HTML渲染)和`jQuery`(处理表单和文件操作)。
```
pip install fastapi uvicorn pandas jinja2 jquery
```
2. **设置FastAPI路由**:
使用FastAPI定义一个POST路由接收上传的文件:
```python
from fastapi import FastAPI, File, UploadFile
app = FastAPI()
@app.post("/upload_excel/")
async def upload_excel(file: UploadFile = File(...)):
# 将文件写入内存或临时目录
file_path = "temp/" + file.filename
with open(file_path, "wb") as f:
f.write(file.file.read())
return {"message": "File uploaded successfully"}
```
3. **使用Pandas读取Excel数据**:
在后台处理服务中,你可以使用Pandas读取Excel内容并返回给前端展示:
```python
import pandas as pd
async def get_excel_data():
data = pd.read_excel("temp/" + file.filename)
return data.to_dict(orient="records")
@app.get("/get_data/")
async def get_editable_data():
return await get_excel_data()
```
4. **HTML模板设计**:
使用Jinja2创建HTML模板,包含一个表格元素,允许编辑单元格。例如,使用Bootstrap库来美化界面:
```html
<!DOCTYPE html>
<html lang="en">
<head>
<!-- ... Bootstrap CSS and JS imports -->
</head>
<body>
<form id="edit-excel" action="/update_excel" method="post" enctype="multipart/form-data">
{{ data|tojson|safe }}
<!-- Add table generated using Jinja2 template syntax -->
</form>
<script src="https://code.jquery.com/jquery-3.6.0.min.js"></script>
<script>
// jQuery for handling cell editing and form submission
</script>
</body>
</html>
```
5. **更新Excel内容并保存**:
用户提交表单后,前端需要发送PUT请求到服务器,并将编辑后的数据更新到Excel文件中。这通常涉及到异步JavaScript处理以及利用pandas的`read_csv`和`to_excel`函数。
6. **处理POST请求更新Excel**:
在FastAPI后端,你还需要设置一个POST路由来接收前端的更新信息,然后更新Excel并保存:
```python
@app.post("/update_excel/")
async def update_excel(data: dict):
df = pd.DataFrame(data)
updated_file_path = "updated_" + file.filename
df.to_excel(updated_file_path, index=False)
return {"message": "Data saved successfully"}
```
阅读全文