xpath获取元素内容
时间: 2023-08-18 22:41:53 浏览: 91
Python lxml解析HTML并用xpath获取元素的方法
要使用XPath获取元素内容,可以使用以下代码:
```python
from lxml import etree
# 假设我们有一个HTML文档
html = """
<html>
<body>
<div class="content">
<h1>标题</h1>
<p>这是一个段落</p>
</div>
</body>
</html>
"""
# 使用lxml库解析HTML
tree = etree.HTML(html)
# 获取class为content的div元素下的h1元素的文本内容
h1_text = tree.xpath('//div[@class="content"]/h1/text()')
print(h1_text)
# 获取class为content的div元素下的p元素的文本内容
p_text = tree.xpath('//div[@class="content"]/p/text()')
print(p_text)
```
输出结果为:
```
['标题']
['这是一个段落']
```
其中,`//div[@class="content"]/h1/text()`表示获取class为content的div元素下的h1元素的文本内容,`//div[@class="content"]/p/text()`表示获取class为content的div元素下的p元素的文本内容。
阅读全文