python读取网页所有的href
时间: 2023-05-18 16:05:36 浏览: 132
获取网页中的所有链接
可以使用Python中的BeautifulSoup库来读取网页中的所有href链接。以下是一个示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = "https://www.example.com"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
for link in soup.find_all("a"):
href = link.get("href")
if href:
print(href)
```
这个代码会发送一个GET请求到指定的URL,并使用BeautifulSoup解析HTML文档。然后,使用find_all方法找到所有的a标签,并使用get方法获取每个a标签的href属性。最后,将所有的href链接打印出来。
阅读全文