用xpath获取<d1> id="list_d1"<dd1><a hredf="https://www.8800text.com/435021/23046123.html"></dd1>中的href
时间: 2023-10-27 19:07:21 浏览: 53
可以使用以下的XPath表达式来获取:
```python
//d1[@id="list_d1"]/dd1/a/@href
```
其中 `//d1[@id="list_d1"]` 表示选择id为list_d1的d1元素,`/dd1/a` 表示选择该d1元素下的dd1元素和a元素,`/@href` 表示获取a元素的href属性值。
相关问题
用xpath获取<d1> id="list_d1"<dd><a hredf="https://www.8800text.com/435021/23046123.html"></dd>中的href
可以使用以下的XPath表达式来获取该链接的href属性:
```xpath
//dl[@id='list_d1']/dd/a/@href
```
解释一下上述XPath表达式:
- `//dl[@id='list_d1']`: 选择id为list_d1的dl元素
- `/dd/a`: 选择dl元素下的dd元素和a元素
- `/@href`: 获取a元素的href属性值
完整的Python代码如下:
```python
from lxml import html
# HTML文本
html_text = """
<dl id="list_d1">
<dd><a href="https://www.8800text.com/435021/23046123.html">Link text</a></dd>
</dl>
"""
# 解析HTML文本
root = html.fromstring(html_text)
# 获取链接的href属性
href = root.xpath("//dl[@id='list_d1']/dd/a/@href")[0]
print(href) # 输出:https://www.8800text.com/435021/23046123.html
```
< a href="https://u.jd.com/aqGDa6F" target="_blank"> ,怎么使用xpath取得href的值
使用XPath获取这个`<a>`元素的`href`属性值可以使用如下的XPath表达式:
```
//a/@href
```
这个表达式中,`//a`表示选择文档中所有的`<a>`元素,`/@href`表示选择`<a>`元素的`href`属性。因此,这个表达式将返回文档中所有`<a>`元素的`href`属性值。如果你只想获取某个特定`<a>`元素的`href`属性值,可以修改表达式,如下所示:
```
//a[@target='_blank']/@href
```
这个表达式中,`[@target='_blank']`指定了`target`属性的值为`_blank`,因此只会选择`target`属性为`_blank`的`<a>`元素,然后再选择它们的`href`属性。
阅读全文