如何利用python的pyquery库查找HTML代码中相同属性的值有多少
时间: 2024-02-01 20:13:24 浏览: 71
可以通过 pyquery 库中的 `attr` 方法获取相同属性的值,然后再通过 Python 的 set 类型获取唯一的属性值。示例代码如下:
```python
from pyquery import PyQuery as pq
html = """
<div class="item" id="1">item 1</div>
<div class="item" id="2">item 2</div>
<div class="item" id="3">item 3</div>
<div class="item" id="4">item 4</div>
<div class="item" id="5">item 5</div>
<div class="item" id="5">item 6</div>
"""
# 使用 PyQuery 解析 HTML 代码
doc = pq(html)
# 获取所有具有 id 属性的元素
items = doc('[id]')
# 获取所有元素的 id 属性值并放入集合中
ids = set([item.attr('id') for item in items])
# 输出 id 属性值的数量
print(len(ids)) # 5
```
上述代码中,首先使用 PyQuery 解析 HTML 代码,然后使用 `'[id]'` 选择器获取所有具有 id 属性的元素。接着,使用列表推导式获取所有元素的 id 属性值,并将其放入集合中。最后,输出集合的长度即为 id 属性值的数量。
阅读全文