python中的html.fromstring有什么作用
时间: 2023-07-15 12:13:15 浏览: 325
`html.fromstring()` 是 `lxml` 库中的一个函数,用于将 HTML 字符串解析为 `Element` 对象。它的作用是将 HTML 字符串转换为可以被 Python 操作的树状结构,以方便对其中的元素进行遍历、查找、修改等操作。
具体来说,`html.fromstring()` 接受一个 HTML 字符串作为输入,返回一个 `Element` 对象。这个对象代表了整个 HTML 文档的根节点,通过它可以访问文档中的所有元素节点、文本节点、注释节点等。
例如,可以使用 `html.fromstring()` 将一个 HTML 字符串解析为 `Element` 对象,然后使用 `findall()` 方法查找其中的所有 `a` 标签:
```python
from lxml import html
html_str = """
<html>
<body>
<a href="https://www.google.com">Google</a>
<a href="https://www.baidu.com">Baidu</a>
</body>
</html>
"""
root = html.fromstring(html_str)
links = root.findall('.//a')
for link in links:
print(link.get('href'), link.text)
```
输出:
```
https://www.google.com Google
https://www.baidu.com Baidu
```