python爬虫爬取贴吧图片
时间: 2023-11-15 07:01:34 浏览: 103
Python爬虫可以用来爬取贴吧图片。通过使用urllib库和re库,可以获取贴吧页面的HTML代码,并从中提取出图片链接。然后使用urllib库中的urlretrieve方法将图片下载到本地。下面是一个简单的Python爬虫代码示例,可以爬取指定贴吧页面的所有图片:
```
# coding:utf-8
import urllib
import re
def get_html(url):
page = urllib.request.urlopen(url)
html = page.read()
return html
def get_image(html_code):
reg = r'src="(.+?\.jpg)" width'
reg_img = re.compile(reg)
imglist = reg_img.findall(html_code.decode('utf-8'))
x = 0
for img in imglist:
urllib.request.urlretrieve(img, '%s.jpg' %x)
x += 1
print(u'-------网页图片抓取-------')
print(u'请输入url:')
url = input()
if url:
pass
else:
print(u'---没有地址输入正在使用默认地址---')
url = 'http://tieba.baidu.com/p/1753935195'
print(u'----------正在获取网页---------')
html_code = get_html(url)
print(u'----------正在下载图片---------')
get_image(html_code)
print(u'-----------下载成功-----------')
input('Press Enter to exit')
```
阅读全文