如何通过xpath方法取出标签'a'中的数据
时间: 2023-06-14 20:03:49 浏览: 82
假设我们要取出以下HTML代码中所有a标签中的数据:
```html
<html>
<body>
<div>
<a href="https://www.example.com">Example Website</a>
<a href="https://www.google.com">Google</a>
<a href="https://www.baidu.com">Baidu</a>
</div>
</body>
</html>
```
我们可以使用以下XPath表达式来选取所有a标签中的数据:
```python
//a/text()
```
其中,`//`表示匹配所有子孙节点,`a`表示匹配所有a标签,`text()`表示选取a标签中的文本内容。
使用Python的lxml库可以实现XPath的解析,代码如下:
```python
from lxml import etree
html = '''
<html>
<body>
<div>
<a href="https://www.example.com">Example Website</a>
<a href="https://www.google.com">Google</a>
<a href="https://www.baidu.com">Baidu</a>
</div>
</body>
</html>
'''
selector = etree.HTML(html)
result = selector.xpath('//a/text()')
print(result)
```
输出结果为:
```
['Example Website', 'Google', 'Baidu']
```
阅读全文