首页如何通过xpath方法取出标签'a'中的数据

如何通过xpath方法取出标签'a'中的数据

时间: 2023-06-14 20:03:49 浏览: 82

假设我们要取出以下HTML代码中所有a标签中的数据： ```html <html> <body> <div> <a href="https://www.example.com">Example Website</a> <a href="https://www.google.com">Google</a> <a href="https://www.baidu.com">Baidu</a> </div> </body> </html> ``` 我们可以使用以下XPath表达式来选取所有a标签中的数据： ```python //a/text() ``` 其中，`//`表示匹配所有子孙节点，`a`表示匹配所有a标签，`text()`表示选取a标签中的文本内容。使用Python的lxml库可以实现XPath的解析，代码如下： ```python from lxml import etree html = ''' <html> <body> <div> <a href="https://www.example.com">Example Website</a> <a href="https://www.google.com">Google</a> <a href="https://www.baidu.com">Baidu</a> </div> </body> </html> ''' selector = etree.HTML(html) result = selector.xpath('//a/text()') print(result) ``` 输出结果为： ``` ['Example Website', 'Google', 'Baidu'] ```

阅读全文