python爬虫爬取网页数据 固定位置的数据 另存图片
时间: 2023-11-11 10:50:50 浏览: 182
您可以使用Python的requests和BeautifulSoup库来爬取网页数据,并使用正则表达式来从所需的HTML标签中提取固定位置的数据。要保存图片,您可以使用Python的urllib库来下载图片,并使用Pillow库将其另存为所需的格式。以下是可能的代码示例:
```
import requests
from bs4 import BeautifulSoup
import re
import urllib.request
from PIL import Image
# 爬取网页数据
url = 'https://example.com/sample-page'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 提取固定位置的数据
pattern = re.compile(r'^title$', flags=re.IGNORECASE)
title = soup.find('h1', {'class': pattern}).text.strip()
print(title)
# 下载图片并另存为
img_url = 'https://example.com/sample-image.jpg'
urllib.request.urlretrieve(img_url, 'sample-image.jpg')
img = Image.open('sample-image.jpg')
img.save('sample-image.png')
```
请注意,这只是一个基本示例,具体实现方式可能因网站结构而异。为了规避版权问题,请确保您有合法访问和使用所需数据和图片的权限。
阅读全文