python爬虫(十一)爬取贴吧图片
时间: 2023-11-15 22:01:34 浏览: 71
这篇文章介绍了如何使用Python爬虫爬取百度贴吧中的图片。具体步骤如下:
1. 打开百度贴吧,找到每日一图,获取图片的url地址。
2. 发起请求,以二进制保存图片到本地。
3. 进行翻页操作,获取所有图片的url地址。
4. 分析数据接口,获取图片的标签内容。
这篇文章提供了一个简单的爬虫示例,可以帮助初学者了解Python爬虫的基本原理和操作步骤。但是需要注意的是,爬虫行为可能会侵犯他人的权益,应该遵守相关法律法规和道德规范,不要滥用爬虫技术。
相关问题
python爬虫爬取贴吧图片
Python爬虫可以用来爬取贴吧图片。通过使用urllib库和re库,可以获取贴吧页面的HTML代码,并从中提取出图片链接。然后使用urllib库中的urlretrieve方法将图片下载到本地。下面是一个简单的Python爬虫代码示例,可以爬取指定贴吧页面的所有图片:
```
# coding:utf-8
import urllib
import re
def get_html(url):
page = urllib.request.urlopen(url)
html = page.read()
return html
def get_image(html_code):
reg = r'src="(.+?\.jpg)" width'
reg_img = re.compile(reg)
imglist = reg_img.findall(html_code.decode('utf-8'))
x = 0
for img in imglist:
urllib.request.urlretrieve(img, '%s.jpg' %x)
x += 1
print(u'-------网页图片抓取-------')
print(u'请输入url:')
url = input()
if url:
pass
else:
print(u'---没有地址输入正在使用默认地址---')
url = 'http://tieba.baidu.com/p/1753935195'
print(u'----------正在获取网页---------')
html_code = get_html(url)
print(u'----------正在下载图片---------')
get_image(html_code)
print(u'-----------下载成功-----------')
input('Press Enter to exit')
```
python爬虫随机爬取图片
以下是使用Python爬虫随机爬取图片的示例代码:
```python
import requests
import random
# 定义图片存储路径
path = 'image/'
# 定义请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 定义图片链接列表
url_list = ['https://picsum.photos/200/300/?random' for i in range(10)]
# 遍历链接列表,下载图片
for url in url_list:
# 发送请求
response = requests.get(url, headers=headers)
# 获取图片名称
image_name = path + str(random.randint(1, 100)) + '.jpg'
# 保存图片
with open(image_name, 'wb') as f:
f.write(response.content)
```
该示例代码使用requests库发送请求,随机生成图片链接,然后遍历链接列表,下载图片并保存到本地。其中,通过random库生成随机数作为图片名称,避免重复。你可以根据自己的需求修改图片链接列表和图片存储路径。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)