用正则表达式获取链家网标签为<div='content__pg'>中data-totalpage属性值的代码
时间: 2024-04-01 15:34:07 浏览: 15
可以使用正则表达式和 requests 库来获取链家网标签为 `<div class="content__pg">` 中 `data-totalpage` 属性值的代码,代码示例如下:
```python
import re
import requests
url = 'https://jn.lianjia.com/zufang/'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
html = response.text
pattern = re.compile(r'<div class="content__pg".*?data-totalpage="(\d+)".*?>', re.S)
result = pattern.findall(html)
print(result)
```
这里使用了正则表达式 `<div class="content__pg".*?data-totalpage="(\d+)".*?>`,其中 `(\d+)` 表示匹配一个或多个数字,并将其作为一个分组,方便后续调用。`re.S` 标志表示让 `.` 匹配任何字符,包括换行符。
如果匹配成功,`result` 的值将是一个列表,包含所有满足条件的匹配结果。如果没有匹配成功,`result` 的值将是一个空列表。
相关推荐
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>图书商城-图书列表</title> <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1"> <script src="https://cdn.bootcss.com/vue/2.5.16/vue.min.js"></script> <script src="https://unpkg.com/axios/dist/axios.min.js"></script> </head> <body> 0"> {{bk.bookName}} ¥{{bk.bookPrice}} <iframe src="footer.html" frameborder="0" scrolling="no" width="100%" height="245px"></iframe> <script src="/BookShopSystem_war/layui/layui.js"></script>这是完整的html代码,请结合你给出的分页功能整合出完整的代码
修改这段代码 首页 上一页 下一页 最后一页
跳转到: <input id="pageNo" type="text" class="form-control form1" name="pageNo" value="${list.pageNo}" /> 每页记录数: <input class="form-control form1" type="text" name="pageCount" value="${list.pageCount}" /> <input class="btn btn-primary" type="submit" value="跳转" /> 共有 ${list.totalPage} 页
跳转到: <input id="pageNo" type="text" class="form-control form1" name="pageNo" value="${list.pageNo}" /> 每页记录数: <input class="form-control form1" type="text" name="pageCount" value="${list.pageCount}" /> <input class="btn btn-primary" type="submit" value="跳转" /> 共有 ${list.totalPage} 页