python语言 爬虫爬取qq新闻里面某个新闻里面的图片,给出实例源代码提示或者注释部分用中文。
时间: 2024-03-19 20:41:10 浏览: 65
以下是一个简单的 Python 爬虫程序,可以爬取 QQ 新闻中某个新闻页面中的所有图片,并将其保存到本地:
```python
import requests
from bs4 import BeautifulSoup
import os
# 要爬取的新闻页面 URL
url = "https://new.qq.com/omn/20210114/20210114A0D2G800.html"
# 发送请求,获取页面内容
response = requests.get(url)
html = response.text
# 解析 HTML 页面
soup = BeautifulSoup(html, 'html.parser')
# 获取所有图片标签
img_tags = soup.find_all('img')
# 如果不存在保存图片的文件夹,则创建一个
if not os.path.exists('./images'):
os.mkdir('./images')
# 遍历所有图片标签,下载图片并保存到本地
for img_tag in img_tags:
img_url = img_tag['src']
img_name = img_url.split('/')[-1]
img_path = './images/' + img_name
with open(img_path, 'wb') as f:
f.write(requests.get(img_url).content)
```
上述代码使用了 `requests` 库来发送 HTTP 请求,使用了 `BeautifulSoup` 库来解析 HTML 页面。程序首先发送请求获取新闻页面的 HTML 内容,然后使用 `BeautifulSoup` 解析 HTML 获取页面中的所有图片标签。接下来,程序遍历所有图片标签,提取图片的 URL,将其下载到本地,并保存到指定的文件夹中。
阅读全文