用正则表达式爬取网页“https://baijiahao.baidu.com/s?id=1760516731981062481”内地址为“https://pics1.baidu.com/feed/6a600c338744ebf8ed49fd5d10a308216059a77b.jpeg@f_auto?token=88be0b06b6dc6d74f0babe2da72cee48”的图片
时间: 2023-06-23 11:08:34 浏览: 428
以下是使用Python中的正则表达式爬取该网页中指定图片链接的示例代码:
```python
import re
import requests
url = 'https://baijiahao.baidu.com/s?id=1760516731981062481'
response = requests.get(url)
html = response.text
pattern = r'"objURL":"(https://pics1\.baidu\.com/feed/[^"]+\.jpeg\?[^"]+)"'
match = re.search(pattern, html)
if match:
image_url = match.group(1)
print(image_url)
else:
print('No match found.')
```
使用`requests`库发送GET请求获取网页源代码,然后使用正则表达式匹配出符合要求的图片链接。在本例中,正则表达式的模式字符串中,`[^"]+`表示匹配除了双引号以外的任意字符,`\.`表示匹配实际的点,`\?`表示匹配实际的问号,`()`表示捕获匹配内容以便后续使用。如果正则表达式匹配成功,`match.group(1)`将返回捕获的图片链接。
相关问题
PS C:\Users\chenxianqiang> & D:/python3/python.exe d:/pythonbaijiahao/baijiahao.py d:\pythonbaijiahao\baijiahao.py:22: DeprecationWarning: executable_path has been deprecated, please pass in a Service object driver = webdriver.Chrome(r"D:\python3\Scripts\chromedriver.exe")
这段代码中同样出现了一个 DeprecationWarning,警告您使用的是已过时的方法。建议您改用新的方法来替代,例如:
```python
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
driver = webdriver.Chrome(ChromeDriverManager().install())
```
这里使用 webdriver_manager 来安装和管理 ChromeDriver,避免了手动下载和指定 chromedriver 路径的麻烦。
Traceback (most recent call last): File "baijiahao.py", line 6, in <module> File "selenium\webdriver\chrome\webdriver.py", line 70, in __init__ File "selenium\webdriver\chromium\webdriver.py", line 90, in __init__ File "selenium\webdriver\common\service.py", line 81, in start selenium.common.exceptions.WebDriverException: Message: 'chromedriver.exe' executable needs to be in PATH. Please see https://chromedriver.chromium.org/home
这个错误是因为 Python 找不到 ChromeDriver 可执行文件的路径,您需要将 ChromeDriver 可执行文件的路径添加到系统的 PATH 环境变量中。您可以按照以下步骤操作:
1. 下载 ChromeDriver,下载地址为:https://sites.google.com/a/chromium.org/chromedriver/downloads
2. 解压下载的压缩包,将其中的 chromedriver.exe 文件复制到您的 Python 程序所在的目录中,或者您自己指定的其他目录中。
3. 将 chromedriver.exe 文件所在的目录添加到系统的 PATH 环境变量中。您可以按照以下步骤操作:
a. 右键点击“计算机”或“此电脑”,选择“属性”;
b. 点击“高级系统设置”,进入“系统属性”窗口;
c. 在“高级”选项卡下,点击“环境变量”;
d. 在“系统变量”中找到“Path”,双击打开;
e. 点击“新建”,输入 chromedriver.exe 所在的目录路径,点击“确定”;
f. 保存所有设置,重新打开您的 Python 程序,问题应该就解决了。
祝您成功!
阅读全文