python中xpath解析html
时间: 2023-12-29 12:26:46 浏览: 97
Python中利用xpath解析HTML的方法
5星 · 资源好评率100%
在Python中,可以使用lxml库的xpath方法来解析HTML。下面是一个简单的示例:
```python
from lxml import html
# 创建一个HTML文档
html_doc = """
<html>
<body>
<h1>标题</h1>
<p>段落1</p>
<p>段落2</p>
</body>
</html>
"""
# 使用lxml的xpath方法解析HTML
tree = html.fromstring(html_doc)
# 使用xpath表达式获取所有的段落元素
paragraphs = tree.xpath('//p')
# 打印每个段落的文本内容
for p in paragraphs:
print(p.text)
```
输出结果:
```
段落1
段落2
```
这个示例中,我们首先创建了一个HTML文档,然后使用lxml的`fromstring`方法将其转换为一个可解析的树形结构。接下来,我们使用xpath表达式`//p`来获取所有的段落元素,并使用`text`属性获取每个段落的文本内容。
阅读全文