https://www.nipic.com/

如果你想编写一个用于匹配 `https://www.nipic.com/` 这个网址的正则表达式，可以使用以下模式： ``` ^https:\/\/www\.nipic\.com\/$ ``` 这个正则表达式的含义是： - `^` 表示匹配字符串的开头 - `https:\/\/` 表示精确匹配 "https://" 这个协议部分 - `www\.nipic\.com` 表示精确匹配 "www.nipic.com" 这个域名部分，使用 `\.` 来转义匹配点号（.） - `\/` 表示精确匹配 "/" 这个路径部分 - `$` 表示匹配字符串的结尾这个正则表达式只能精确匹配 `https://www.nipic.com/` 这个网址，如果你需要匹配更多的变种或者特定规则的网址，可能需要调整和扩展这个正则表达式。请注意，正则表达式只是一种模式匹配工具，对于复杂的网址规则，也可以考虑使用其他方法来处理。

<li class="new-works-box fl"> <a class="relative block works-detail hover-none new-works-img-box" title="湖洞水风光" hidefocus="true" href="//www.nipic.com/show/43693997.html"><span class="for-vertical"></span><span><img src="//static.ntimg.cn/original/images/grey.gif" data-src="//pic.nximg.cn/pic/20230525/9446643_143102439100_4.jpg" alt="湖洞水风光"/></span></a> <div class="new-search-works-info"> <a href="//www.nipic.com/show/43693997.html" class="search-works-name ellipsis search-left-box" title="湖洞水风光">湖洞水风光</a> <span class="search-works-price search-right-box">共享分:<span class="red">100</span></span> </div> </li> 爬虫提取出这段文本中的title和data-src

可以使用正则表达式来提取出title和data-src，示例代码如下： ```python import re text = '<li class="new-works-box fl"> <a class="relative block works-detail hover-none new-works-img-box" title="湖洞水风光" hidefocus="true" href="//www.nipic.com/show/43693997.html"><span class="for-vertical"></span><span><img src="//static.ntimg.cn/original/images/grey.gif" data-src="//pic.nximg.cn/pic/20230525/9446643_143102439100_4.jpg" alt="湖洞水风光"/></span></a> <div class="new-search-works-info"> <a href="//www.nipic.com/show/43693997.html" class="search-works-name ellipsis search-left-box" title="湖洞水风光">湖洞水风光</a> <span class="search-works-price search-right-box">共享分:<span class="red">100</span></span> </div> </li>' title_pattern = re.compile(r'title="([^"]*)"') data_src_pattern = re.compile(r'data-src="([^"]*)"') title_match = title_pattern.search(text) data_src_match = data_src_pattern.search(text) if title_match: title = title_match.group(1) print(title) if data_src_match: data_src = data_src_match.group(1) print(data_src) ``` 输出结果： ``` 湖洞水风光 //pic.nximg.cn/pic/20230525/9446643_143102439100_4.jpg ```

python爬虫图片代码

以下是一个Python爬虫图片的代码示例： ```python import requests import re import urllib from io import BytesIO from PIL import Image def get_pictures(url): data = requests.get(url).text regex = r'<img src="(.*?.jpg)"' pa = re.compile(regex) images = re.findall(pa, data) i = 0 print('*****Starting*****') for image in images: if '" data-original="' in image: address = image.split('" data-original="')[1] else: address = image i += 1 image = requests.get(address) image = Image.open(BytesIO(image.content)) image.save('D:\\111\\' + str(i) + '.jpg') print("*****Ending*****") if __name__ == '__main__': url = "http://soso.nipic.com/q_中国交通and隧道景观_g_0.html" get_pictures(url) print("OK!!!") ```

https://www.nipic.com/

python爬虫图片代码

相关推荐

Nipic_682236_20191221143128009088.cdr

Linux基础课件-网络管理命令-wget命令.pptx

Nipic_20180988_20201228093425454000.psd

CCD式铆合测定机保养说明书.doc

IOS操作系统开发/调试的案例

【精美排版】基于STCC单片机的简易电子琴.doc

【精品】毕业设计：单片机模拟交通灯设计.doc

ATM系统需求说明书.doc

线性离散系统的Z变换分析法-2

DF8B机车32位微机控制柜使用维护说明书.doc

ip2region.xdb

IBM业务流程和运营决策管理产品词汇表中英文

【精美排版】基于单片机ATC电子琴课程设计.doc

数据挖掘与数据分析应用案例 数据挖掘算法实践 基于Python的数据挖掘在超市中的应用与分析.doc

基于Bootstrap实现的完全响应式后台管理模板页面，多平台自动适应

电力变压器保护毕业设计.doc

图论的思维导图-复习.xmind

最新推荐

CCD式铆合测定机保养说明书.doc

IOS操作系统开发/调试的案例

【精美排版】基于STCC单片机的简易电子琴.doc

【精品】毕业设计：单片机模拟交通灯设计.doc

ATM系统需求说明书.doc

数据结构课程设计：模块化比较多种排序算法

管理建模和仿真的文件

STM32单片机小车智能巡逻车设计与实现：打造智能巡逻车，开启小车新时代

devc++如何监视

哈夫曼树实现文件压缩解压程序分析

数据挖掘与数据分析应用案例数据挖掘算法实践基于Python的数据挖掘在超市中的应用与分析.doc