<li class="col-md-6 col-sm-4 col-xs-3"> <a class="myui-vodlist__thumb lazyload" href="/yhdm/1.html" title="海贼王" data-original="/uploads/allimg/202107/1e78c58b1cfef8fe.jpg"> <span class="play hidden-xs"></span> <span class="pic-tag pic-tag-top"> 4.0分 </span> <span class="pic-text text-right"> 更新至1063集 </span> </a> <div class="myui-vodlist__detail"> <h4 class="title text-overflow"><a href="/yhdm/1.html" title="海贼王">海贼王</a></h4> </div> </li>用正则表达式提取文字和数字
时间: 2023-10-19 18:05:35 浏览: 525
可以使用如下正则表达式提取文字和数字:
```python
import re
text = '<li class="col-md-6 col-sm-4 col-xs-3"> <a class="myui-vodlist__thumb lazyload" href="/yhdm/1.html" title="海贼王" data-original="/uploads/allimg/202107/1e78c58b1cfef8fe.jpg"> <span class="play hidden-xs"></span> <span class="pic-tag pic-tag-top"> 4.0分 </span> <span class="pic-text text-right"> 更新至1063集 </span> </a> <div class="myui-vodlist__detail"> <h4 class="title text-overflow"><a href="/yhdm/1.html" title="海贼王">海贼王</a></h4> </div> </li>'
pattern = r'<li class=".*?"><a.*? title="(.*?)" data-original="(.*?)">.*?([\d\.]+)分.*?更新至(\d+)集.*?</a>.*?</li>'
result = re.findall(pattern, text)
print(result)
```
输出结果为:
```python
[('海贼王', '/uploads/allimg/202107/1e78c58b1cfef8fe.jpg', '4.0', '1063')]
```
其中,元组中的第一个值为文字“海贼王”,第三个值为数字“4.0”,第四个值为数字“1063”。
阅读全文