python xpath 匹配所有a标签
时间: 2023-11-04 11:05:15 浏览: 100
利用xpath提取标签下所有文本
可以使用以下代码实现:
from lxml import etree
# 构造HTML文档
html_str = '''
<html>
<body>
<a href="https://www.baidu.com">百度首页</a>
<a href="https://www.csdn.net">CSDN首页</a>
<a href="https://www.cnblogs.com">博客园首页</a>
</body>
</html>
'''
html = etree.HTML(html_str)
# 获取所有a标签
a_list = html.xpath('//a')
for a in a_list:
print(a.attrib['href'], a.text)
输出结果为:
https://www.baidu.com 百度首页
https://www.csdn.net CSDN首页
https://www.cnblogs.com 博客园首页
阅读全文