bs4获取标签内的href
时间: 2024-06-08 15:05:26 浏览: 180
可以使用BeautifulSoup库中的find方法来获取标签内的href属性值。例如,假设我们想要获取一个网页中所有a标签的href属性,可以使用以下代码:
```python
from bs4 import BeautifulSoup
import requests
url = 'https://www.example.com'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
links = soup.find_all('a') # 获取所有a标签
for link in links:
href = link.get('href') # 获取href属性值
print(href)
```
这样就可以打印出网页中所有a标签的href属性值了。注意,如果某个a标签没有href属性,则该标签的get方法会返回None。
相关问题
bs4获取指定标签内的href
可以使用BeautifulSoup模块的find_all方法来查找所有指定标签,然后使用get方法获取href属性的值。
举个例子,如果想获取所有a标签内的href属性值,可以这样写:
```python
from bs4 import BeautifulSoup
import requests
url = 'https://www.baidu.com/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
a_tags = soup.find_all('a') # 查找所有a标签
for a in a_tags:
href = a.get('href') # 获取href属性值
print(href)
```
这样就可以将所有a标签内的href属性值打印出来了。
bs4获取a标签里的href
可以使用BeautifulSoup模块中的find_all()方法来获取所有的a标签,然后再使用get()方法获取href属性的值,如下所示:
```python
from bs4 import BeautifulSoup
html = """
<html>
<body>
<a href="https://www.google.com">Google</a>
<a href="https://www.baidu.com">Baidu</a>
<a href="https://www.bing.com">Bing</a>
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
links = soup.find_all('a')
for link in links:
print(link.get('href'))
```
输出结果为:
```
https://www.google.com
https://www.baidu.com
https://www.bing.com
```
阅读全文