beautifulsoup 提取超链接
时间: 2023-10-31 18:04:28 浏览: 130
提取出超链接部分
4星 · 用户满意度95%
您可以使用BeautifulSoup库来提取超链接。下面是一个简单的示例代码:
```python
from bs4 import BeautifulSoup
import requests
# 通过requests库获取网页内容
url = 'https://www.example.com'
response = requests.get(url)
html_content = response.text
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html_content, 'html.parser')
# 提取所有超链接
links = soup.find_all('a')
# 打印提取到的超链接
for link in links:
href = link.get('href')
print(href)
```
在这个示例中,我们首先使用requests库获取网页的内容,然后使用BeautifulSoup库解析该内容。通过调用`find_all('a')`方法,我们可以提取所有的超链接。最后,我们使用`get('href')`方法获取每个超链接的URL,并打印出来。
请注意,您需要将`https://www.example.com`替换为您要提取超链接的网页URL。
阅读全文