python BeautifulSoup获取img的src
时间: 2023-05-25 12:02:04 浏览: 482
A:
使用BeautifulSoup库中的find_all方法可以获取HTML文本中所有的img标签,然后遍历每个img标签,使用get方法获取其对应的src属性。
示例代码如下:
```python
from bs4 import BeautifulSoup
import requests
url = 'https://www.example.com'
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
imgs = soup.find_all('img')
for img in imgs:
print(img.get('src'))
```
其中,url为需要获取img的页面地址,response为使用requests库获取页面内容的响应对象,html为获取到的页面内容,soup为BeautifulSoup对象,imgs为所有的img标签,img.get('src')即可获取每个img标签的src属性。
相关问题
python beautifulsoup4 findall 之后获取 img limian de src
可以使用以下代码获取img标签中的src属性:
```python
from bs4 import BeautifulSoup
import requests
url = 'http://example.com' # 网页链接
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
imgs = soup.find_all('img') # 找到所有的img标签
for img in imgs:
src = img.get('src') # 获取img标签的src属性
print(src)
```
其中,`response.content`表示网页的原始内容,`html.parser`是解析器。后面的代码通过遍历找到的`img`标签,使用`get()`方法获取`src`属性值,并打印输出。
python BeautifulSoup爬取某个网址下所有a标签内的内容以及图片
好的,可以使用Python的BeautifulSoup库来实现这个功能。以下是代码示例:
```python
import requests
from bs4 import BeautifulSoup
import os
# 设置要爬取的网址
url = 'https://www.example.com/'
# 发送HTTP请求
response = requests.get(url)
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有的a标签
a_tags = soup.find_all('a')
# 遍历所有的a标签
for a_tag in a_tags:
# 输出a标签内的文本内容
print(a_tag.text)
# 查找a标签内的img标签
img_tags = a_tag.find_all('img')
# 遍历所有的img标签
for img_tag in img_tags:
# 输出img标签的src属性值
print(img_tag['src'])
# 下载图片
img_url = img_tag['src']
img_name = img_url.split('/')[-1] # 获取图片文件名
img_response = requests.get(img_url) # 发送HTTP请求
with open(os.path.join('images', img_name), 'wb') as f: # 保存图片到本地
f.write(img_response.content)
```
以上代码会输出网页中所有a标签内的文本内容,并将每个a标签内的所有img标签的src属性值输出,同时将图片下载到本地的一个名为“images”的文件夹下。你可以根据自己的需要修改代码。
阅读全文