通过网站开发者模式抓取页面文本及图片超链接,给出获取其href的代码
时间: 2023-12-06 14:40:00 浏览: 208
获取页面中的所有链接(包括文本链接和图片链接)的href属性可以使用Python的BeautifulSoup库来实现,以下是示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 发送HTTP请求获取页面内容
url = 'https://example.com'
response = requests.get(url)
# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 获取所有链接的href属性
links = []
for link in soup.find_all('a'):
href = link.get('href')
if href:
links.append(href)
for img in soup.find_all('img'):
src = img.get('src')
if src:
links.append(src)
# 打印所有链接
for link in links:
print(link)
```
其中,`soup.find_all('a')`用于获取所有`<a>`标签,`link.get('href')`用于获取`<a>`标签的href属性,`soup.find_all('img')`用于获取所有`<img>`标签,`img.get('src')`用于获取`<img>`标签的src属性。最后将所有链接的href属性保存到一个列表中并打印出来。