python 正则匹配 <li class="row pl20 tc bor-t1s04 clearfix"> 开始 任意 > 444(这里需要获取的数字)任意中文
时间: 2023-06-09 21:02:28 浏览: 64
的结束 </li> ,应该如何写正则表达式?
答:您可以使用以下正则表达式来匹配该字符串:
```python
import re
text = '<li class="row pl20 tc bor-t1s04 clearfix"> 开始 任意 > 444(这里需要获取的数字)任意中文的结束 </li>'
match = re.search(r'<li.*?>.*?>\s*(\d+).*?</li>', text)
number = match.group(1)
print(number) # 输出: 444
```
该正则表达式的含义是:匹配以 `<li` 开始,结尾为 `</li>` 的字符串,其中可能包括其他任意字符,但需要至少包含一个数字,该数字会被提取出来作为匹配结果。
相关问题
正则匹配 第一个 <li class="row pl20 tc bor-t1s04 clearfix"><a href="//rank.chinaz.com/baidumobile/aladdin/jd.com" target="_blank"><em class="color-63">1176个阿拉丁,点击</em>查看更多</a></li> 匹配启众1176数字 (?<=<li class="row pl20 tc bor-t1s04 clearfix">.*?<em class="color-63">) 怎么写
你可以使用以下的正则表达式来匹配启众1176数字:
```(?<=<li class="row pl20 tc bor-t1s04 clearfix">.*?<em class="color-63">)\d+```
解释:
* `(?<=...)`:表示正则表达式必须满足括号中的条件,但不包括括号内容在匹配结果中;
* `<li class="row pl20 tc bor-t1s04 clearfix">.*?<em class="color-63">`:表示需要匹配的字符串,包含了整个`<li>`标签以及后面的文字;
* `\d+`:表示需要匹配的数字,可以有多位。
使用上述正则表达式可以匹配启众1176数字。
<li class="row pl20 tc bor-t1s04 clearfix"><a href="//rank.chinaz.com/baidumobile/aladdin/jd.com" target="_blank"><em class="color-63">1176个阿拉丁,点击</em>查看更多</a></li> 匹配启众1176数字 (?<=<li class="row pl20 tc bor-t1s04 clearfix">.*?<em class="color-63">) 后面怎么写
匹配启众1176数字的正则表达式应该是:(?<=<li class="row pl20 tc bor-t1s04 clearfix">.*?<em class="color-63">)[0-9]+。其中,(?<=...)表示肯定式顺序环视,匹配紧跟在<li class="row pl20 tc bor-t1s04 clearfix">.*?<em class="color-63">后面的数字,[0-9]+表示连续匹配数字。
阅读全文