from bs4 import BeautifulSoup soup1 = BeautifulSoup(open("index.html"),features='lxml') print(soup1.prettify())
时间: 2023-10-28 14:55:42 浏览: 133
import sys import os import urllib from bs4 import BeautifulSoup
这段代码使用了Python的BeautifulSoup库来解析HTML文件。首先导入了BeautifulSoup模块,然后使用open函数打开名为"index.html"的文件,并使用lxml解析器来解析HTML。接着将解析后的HTML文件转换为Unicode编码,并使用prettify()方法美化输出,最后将结果打印出来。这样能够让HTML文件的结构更加清晰易读。
阅读全文