实现通用html转json
时间: 2024-11-03 14:15:44 浏览: 11
dicom-standard:使用Python脚本从HTML版本解析的JSON格式的DICOM标准
实现HTML转换成JSON通常涉及到解析HTML文档,提取其中的数据,并将其结构组织成符合JSON格式的对象。这可以通过编程语言中的库函数或者第三方工具来完成。以下是Python中使用BeautifulSoup库的一个简单示例:
```python
from bs4 import BeautifulSoup
import json
def html_to_json(html_content):
soup = BeautifulSoup(html_content, 'lxml') # 使用BeautifulSoup解析HTML
data = {} # 创建一个空字典用于存储结果
for element in soup.find_all(True): # 遍历所有标签
tag_name = element.name
if tag_name not in data: # 如果该元素的tag还没在data中,创建一个新的键值对
data[tag_name] = []
data[tag_name].append(element.text) # 将元素的内容添加到对应数组中
return json.dumps(data, ensure_ascii=False) # 将数据转化为JSON并返回
# 示例HTML
html_example = '<div><h1>Example</h1><p>Hello <a href="#">World</a></p></div>'
converted_json = html_to_json(html_example)
print(converted_json)
```
阅读全文