提取形如 href="https://www.xxsy.net/category/1.html" 的字符串
时间: 2023-06-09 22:06:14 浏览: 49
可以使用正则表达式来提取这种形式的字符串,例如:
```python
import re
text = '这是一个链接 <a href="https://www.xxsy.net/category/1.html">小说</a>'
pattern = r'href="([^"]+)"'
match = re.search(pattern, text)
if match:
print(match.group(1)) # https://www.xxsy.net/category/1.html
else:
print('未匹配到任何链接')
```
这段代码可以从 `text` 变量中提取出 `https://www.xxsy.net/category/1.html` 这个链接地址。其中 `r'href="([^"]+)"'` 是一个正则表达式,用来匹配 `<a>` 标签中的 `href` 属性值。`([^"]+)` 用来表示一段连续的不包含双引号字符的字符串。
相关问题
嗯,我先试试用v2签名的方式,帮我基于这串命令写个v2的签名:jarsigner -verbose -keystore D:\apk-nixiang\xbws1.jks -signedjar last.apk D:\apk-nixiang\zzzApk\dist\xxsy.apk daw
好的,以下是使用v2签名方式进行签名的命令:
```
jarsigner -verbose -keystore D:\apk-nixiang\xbws1.jks -sigalg SHA256withRSA -digestalg SHA-256 -signedjar last.apk D:\apk-nixiang\zzzApk\dist\xxsy.apk bws1
```
其中,-sigalg参数指定使用的签名算法为SHA256withRSA,-digestalg参数指定摘要算法为SHA-256,bws1为keystore文件中存储密钥对的别名。
请注意,使用v2签名方式需要确保您的Android Gradle插件版本在1.6.0以上,否则可能会出现签名失败的情况。建议您先检查您的Android Gradle插件版本再进行签名。
用Selenium库爬取潇湘书院全部作品页面中的h4标签,用正则表达式爬取页面中h2标签
可以使用以下代码来爬取潇湘书院全部作品页面中的h4标签和h2标签:
```python
import re
import time
from selenium import webdriver
# 使用Chrome浏览器驱动
driver = webdriver.Chrome()
# 访问潇湘书院全部作品页面
driver.get('http://www.xxsy.net/partner/all.html')
# 等待页面加载完成
time.sleep(5)
# 使用正则表达式提取页面中的h4标签和h2标签
h4_pattern = re.compile(r'<h4>(.*?)</h4>')
h4_list = h4_pattern.findall(driver.page_source)
h2_pattern = re.compile(r'<h2>(.*?)</h2>')
h2_list = h2_pattern.findall(driver.page_source)
# 输出提取到的h4标签和h2标签
print(h4_list)
print(h2_list)
# 关闭浏览器
driver.quit()
```
这段代码首先使用selenium库访问潇湘书院全部作品页面,然后使用time库等待页面加载完成。接着,使用正则表达式提取页面中的h4标签和h2标签,并输出提取到的结果。注意,在使用selenium库访问页面时,需要等待页面完全加载完成之后才能进行后续操作,这里使用了time库来进行等待。