用xpath获取<d1> id="list_d1"<dd><a hredf="https://www.8800text.com/435021/23046123.html"></dd>中的href不存href - CSDN文库

首先，您需要使用XPath表达式选择`<a>`元素。然后，您可以使用`@`符号和`href`属性来获取该元素的`href`值。以下是一个示例XPath表达式： ```python //d1[@id="list_d1"]/dd/a/@href ``` 您可以将此表达式传递给您所选的XPath解析器，以获取与该表达式匹配的所有节点的`href`属性值。在Python中，您可以使用`lxml`库来解析HTML并执行XPath查询。以下是一个示例代码： ```python from lxml import html # 从字符串中解析HTML html_string = '<d1 id="list_d1"><dd><a href="https://www.8800text.com/435021/23046123.html"></a></dd></d1>' tree = html.fromstring(html_string) # 执行XPath查询并获取href属性值 hrefs = tree.xpath('//d1[@id="list_d1"]/dd/a/@href') print(hrefs) # 输出：['https://www.8800text.com/435021/23046123.html'] ``` 注意，该示例代码中的HTML字符串只包含一个`<a>`元素，但是您可以根据需要扩展该表达式来选择多个`<a>`元素，并获取它们的`href`属性值。

相关问题

用xpath获取<d1> id="list_d1"<dd><a hredf="https://www.8800text.com/435021/23046123.html"></dd>中的href

可以使用以下的XPath表达式来获取该链接的href属性： ```xpath //dl[@id='list_d1']/dd/a/@href ``` 解释一下上述XPath表达式： - `//dl[@id='list_d1']`: 选择id为list_d1的dl元素 - `/dd/a`: 选择dl元素下的dd元素和a元素 - `/@href`: 获取a元素的href属性值完整的Python代码如下： ```python from lxml import html # HTML文本 html_text = """ <dl id="list_d1"> <dd><a href="https://www.8800text.com/435021/23046123.html">Link text</a></dd> </dl> """ # 解析HTML文本 root = html.fromstring(html_text) # 获取链接的href属性 href = root.xpath("//dl[@id='list_d1']/dd/a/@href")[0] print(href) # 输出：https://www.8800text.com/435021/23046123.html ```

用xpath获取<d1> id="list_d1"<dd1><a hredf="https://www.8800text.com/435021/23046123.html"></dd1>中的href

可以使用以下的XPath表达式来获取： ```python //d1[@id="list_d1"]/dd1/a/@href ``` 其中 `//d1[@id="list_d1"]` 表示选择id为list_d1的d1元素，`/dd1/a` 表示选择该d1元素下的dd1元素和a元素，`/@href` 表示获取a元素的href属性值。

相关推荐

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通