``` html.parser ```
时间: 2024-02-18 11:58:06 浏览: 27
`html.parser`是Python标准库中的一个模块,用于解析HTML文档。它提供了一种简单的方式来遍历和搜索HTML文档的元素。
在使用`html.parser`之前,需要先导入它:
```python
from html.parser import HTMLParser
```
然后,可以创建一个继承自`HTMLParser`的子类,并重写一些方法来处理HTML文档中的不同元素。例如,可以重写`handle_starttag`方法来处理开始标签,重写`handle_endtag`方法来处理结束标签,重写`handle_data`方法来处理文本数据等。
下面是一个简单的示例代码,演示了如何使用`html.parser`来解析HTML文档并打印出其中的链接:
```python
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_starttag(self, tag, attrs):
if tag == 'a':
for attr in attrs:
if attr[0] == 'href':
print(attr[1])
html = '''
<html>
<body>
<a href="https://www.example.com">Example</a>
<a href="https://www.google.com">Google</a>
</body>
</html>
'''
parser = MyHTMLParser()
parser.feed(html)
```
运行以上代码,会输出两个链接:
```
https://www.example.com
https://www.google.com
```
这是一个简单的示例,实际上`html.parser`还提供了其他一些方法和属性,可以用于更复杂的HTML解析任务。