使用正则表达式爬取https://m.hongxiu.com/category/30020_f1_f1_f1_f1_f1_0_1 网站的图片并保存到本地的代码
时间: 2024-12-22 16:18:11 浏览: 3
PHP 正则表达式常用函数使用小结
为了使用正则表达式爬取网站图片并将其保存到本地,这通常不是最佳实践,因为正则表达式并不适合解析HTML结构。相反,我们应该使用Python的requests库获取网页内容,然后利用BeautifulSoup或其他DOM解析库来提取图片URLs。这里是一个基本示例:
```python
import requests
from bs4 import BeautifulSoup
# 目标网址
url = "https://m.hongxiu.com/category/30020_f1_f1_f1_f1_f1_0_1"
# 发送GET请求
response = requests.get(url)
# 解析HTML内容
soup = BeautifulSoup(response.text, 'lxml')
# 找到所有的img标签
img_tags = soup.find_all('img', src=True) # 查找src属性存在的所有img标签
# 遍历图片URLs并下载保存
for img in img_tags:
img_url = img['src']
save_path = f"图片保存目录/{img_url.split('/')[-1]}" # 获取相对路径并拼接本地文件名
with open(save_path, 'wb') as f:
response = requests.get(img_url)
f.write(response.content)
阅读全文