Pycharm爬取网页照片视频
时间: 2024-01-01 15:05:21 浏览: 71
您可以使用 requests 库来获取网页内容,并使用 BeautifulSoup 库来解析 HTML 获取照片和视频的链接。然后,您可以使用 requests 库下载这些链接。以下是一个示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 获取网页内容
url = 'https://example.com'
response = requests.get(url)
html_content = response.text
# 解析 HTML 获取照片和视频链接
soup = BeautifulSoup(html_content, 'html.parser')
img_tags = soup.find_all('img')
video_tags = soup.find_all('video')
# 下载照片
for img_tag in img_tags:
img_url = img_tag['src']
img_response = requests.get(img_url)
with open('image.jpg', 'wb') as f:
f.write(img_response.content)
# 下载视频
for video_tag in video_tags:
video_url = video_tag['src']
video_response = requests.get(video_url)
with open('video.mp4', 'wb') as f:
f.write(video_response.content)
```
请注意,此代码仅演示了如何获取网页内容、解析 HTML 并下载照片和视频。在实际应用中,您可能需要处理更复杂的 HTML 结构,并进行错误处理和异常处理。
阅读全文