python xpath 解析html
时间: 2024-04-09 07:26:44 浏览: 82
Python中利用xpath解析HTML的方法
5星 · 资源好评率100%
在Python中,可以使用lxml库来解析HTML文档并使用XPath表达式进行定位和提取元素。下面是一个简单的示例演示如何使用XPath解析HTML文档:
```python
from lxml import etree
# 将HTML字符串转化为一个Element对象
html = '''
<html>
<body>
<div class="container">
<h1>标题</h1>
<p>段落1</p>
<p>段落2</p>
</div>
</body>
</html>
'''
root = etree.HTML(html)
# 使用XPath表达式定位元素
title = root.xpath('//h1/text()') # 提取<h1>标签的文本内容
paragraphs = root.xpath('//p/text()') # 提取所有<p>标签的文本内容
# 打印结果
print("标题:", title)
print("段落:")
for p in paragraphs:
print(p)
```
运行以上代码,输出结果如下:
```
标题: 标题
段落:
段落1
段落2
```
阅读全文