获取<d1> id="list_d1"<dd><a hredf="https://www.8800text.com/435021/23046123.html"></dd>中的href
时间: 2024-03-18 19:32:07 浏览: 161
您可以使用Python中的BeautifulSoup库来获取<d1>标签中的href链接。以下是一个示例代码:
```python
from bs4 import BeautifulSoup
html = '<d1 id="list_d1"><dd><a href="https://www.8800text.com/435021/23046123.html"></dd></d1>'
soup = BeautifulSoup(html, 'html.parser')
a_tag = soup.find('d1', {'id': 'list_d1'}).find('a')
href = a_tag['href']
print(href)
```
输出结果应为:
```
https://www.8800text.com/435021/23046123.html
```
相关问题
用xpath获取<d1> id="list_d1"<dd><a hredf="https://www.8800text.com/435021/23046123.html"></dd>中的href
可以使用以下的XPath表达式来获取该链接的href属性:
```xpath
//dl[@id='list_d1']/dd/a/@href
```
解释一下上述XPath表达式:
- `//dl[@id='list_d1']`: 选择id为list_d1的dl元素
- `/dd/a`: 选择dl元素下的dd元素和a元素
- `/@href`: 获取a元素的href属性值
完整的Python代码如下:
```python
from lxml import html
# HTML文本
html_text = """
<dl id="list_d1">
<dd><a href="https://www.8800text.com/435021/23046123.html">Link text</a></dd>
</dl>
"""
# 解析HTML文本
root = html.fromstring(html_text)
# 获取链接的href属性
href = root.xpath("//dl[@id='list_d1']/dd/a/@href")[0]
print(href) # 输出:https://www.8800text.com/435021/23046123.html
```
用xpath获取<d1> id="list_d1"<dd1><a hredf="https://www.8800text.com/435021/23046123.html"></dd1>中的href
可以使用以下的XPath表达式来获取:
```python
//d1[@id="list_d1"]/dd1/a/@href
```
其中 `//d1[@id="list_d1"]` 表示选择id为list_d1的d1元素,`/dd1/a` 表示选择该d1元素下的dd1元素和a元素,`/@href` 表示获取a元素的href属性值。
阅读全文