html.parser
时间: 2023-07-20 09:40:11 浏览: 157
HTML Parser是Python标准库中的一个模块,它可以用来解析HTML文档。HTML Parser可以将HTML文档解析为DOM树,然后我们可以通过遍历DOM树来获取HTML文档中的各种元素和属性。HTML Parser提供了一个类HTMLParser,我们可以通过继承HTMLParser类来实现我们自己的HTML解析器。HTML Parser模块的使用方法比较简单,只需要导入模块,创建HTMLParser对象,然后调用parse方法即可。例如:
```
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_starttag(self, tag, attrs):
print("Start tag:", tag)
for attr in attrs:
print(" attr:", attr)
parser = MyHTMLParser()
parser.feed('<html><head><title>Test</title></head><body><p>Hello World!</p></body></html>')
```
这段代码会输出:
```
Start tag: html
Start tag: head
Start tag: title
attr: ('class', 'test')
Start tag: body
Start tag: p
Hello World!
```
阅读全文