python beautifulsoup4 findall 之后获取 img limian de src
时间: 2024-06-10 21:04:23 浏览: 131
可以使用以下代码获取img标签中的src属性:
```python
from bs4 import BeautifulSoup
import requests
url = 'http://example.com' # 网页链接
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
imgs = soup.find_all('img') # 找到所有的img标签
for img in imgs:
src = img.get('src') # 获取img标签的src属性
print(src)
```
其中,`response.content`表示网页的原始内容,`html.parser`是解析器。后面的代码通过遍历找到的`img`标签,使用`get()`方法获取`src`属性值,并打印输出。
相关问题
python beautifulsoup4 findall 之后获取 href
可以使用以下代码来获取 href:
```python
from bs4 import BeautifulSoup
import requests
# 发送请求获取网页内容
response = requests.get(url)
content = response.content
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(content, 'html.parser')
# 查找包含href的标签
links = soup.findAll('a')
# 循环遍历标签获取href
for link in links:
href = link.get('href')
print(href)
```
需要将 `url` 替换为你要获取 href 的网页地址。在上述代码中,我们首先发送请求来获取网页内容,然后使用 BeautifulSoup 库对网页内容进行解析。接着查找所有包含 href 属性的标签,并使用循环遍历每个标签,获取并输出 href。
python BeautifulSoup获取img的src
A:
使用BeautifulSoup库中的find_all方法可以获取HTML文本中所有的img标签,然后遍历每个img标签,使用get方法获取其对应的src属性。
示例代码如下:
```python
from bs4 import BeautifulSoup
import requests
url = 'https://www.example.com'
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
imgs = soup.find_all('img')
for img in imgs:
print(img.get('src'))
```
其中,url为需要获取img的页面地址,response为使用requests库获取页面内容的响应对象,html为获取到的页面内容,soup为BeautifulSoup对象,imgs为所有的img标签,img.get('src')即可获取每个img标签的src属性。
阅读全文