python中xpath定位href标签
时间: 2023-11-08 20:10:33 浏览: 89
关于python中的xpath解析定位
在 Python 中使用 XPath 定位 href 标签,可以使用 `@` 符号来定位标签的属性。以下是一个示例代码:
```python
from lxml import etree
# 构建 HTML 文档
html = '''
<html>
<body>
<a href="https://www.google.com">Google</a>
<a href="https://www.baidu.com">Baidu</a>
</body>
</html>
'''
# 解析 HTML 文档
parser = etree.HTMLParser()
root = etree.fromstring(html, parser)
# 使用 XPath 定位 href 标签
links = root.xpath('//a/@href')
# 输出结果
print(links)
```
上述代码中,首先使用 `etree.HTMLParser()` 解析 HTML 文档,然后使用 `etree.fromstring()` 方法将 HTML 文档转化为 Element 对象。接着使用 `root.xpath()` 方法配合 XPath 表达式 `//a/@href` 来定位所有的 href 属性,最后将结果打印出来。
阅读全文