Parsel+css选择器
时间: 2023-12-25 15:30:34 浏览: 178
Parsel是一个基于Python的库,它允许你使用CSS选择器来解析HTML和XML文档。通过使用Parsel,你可以方便地从网页中提取所需的数据。
下面是一个使用Parsel和CSS选择器的简单示例:
```python
from parsel import Selector
# 创建一个Selector对象,将HTML文档传递给它
html = """
<html>
<body>
<ul>
<li class="multi-chosen"><a href="https://www.example.com">Link 1</a></li>
<li><a href="https://www.example.com">Link 2</a></li>
<li class="multi-chosen"><a href="https://www.example.com">Link 3</a></li>
</ul>
</body>
</html>
"""
selector = Selector(text=html)
# 使用CSS选择器选取class为multi-chosen的li元素下的所有a元素
links = selector.css('li.multi-chosen > a')
# 遍历并打印选取到的链接文本和URL
for link in links:
text = link.css('::text').get()
url = link.attrib['href']
print(f"Link text: {text}")
print(f"Link URL: {url}")
```
运行上述代码,你将会得到以下输出:
```
Link text: Link 1
Link URL: https://www.example.com
Link text: Link 3
Link URL: https://www.example.com
```
这个示例演示了如何使用Parsel和CSS选择器来选取HTML文档中class为multi-chosen的li元素下的所有a元素,并提取它们的文本和URL。
阅读全文