print(url) url = '<span class="rating_num" property="v:average">9.1</span> <span content="10.0" property="v:best"></span> <span>1814630人评价</span>' nums = re.findall(r'<span>\d评价+</span>', str(url), re.S

你可以使用正则表达式来匹配评分人数，例如： ``` nums = re.findall(r'<span>\d+人评价</span>', str(url), re.S | re.M) ``` 这个正则表达式会匹配类似于 `<span>1814630人评价</span>` 这样的文本，其中 `\d+` 表示匹配一个或多个数字。

这个是一个网页解析的我只是复制了一部分</div> <div class="bd"> <p class=""> 导演: 罗伯·莱纳 Rob Reiner 主演: 玛德琳·卡罗尔 Madeline Carroll / 卡...<br/> 2010 / 美国 / 剧情喜剧爱情 </p> <div class="star"> <span class="rating45-t"></span> <span class="rating_num" property="v:average">9.1</span>

如果你想提取电影信息和评分，你可以使用 BeautifulSoup 库进行解析，例如： ``` from bs4 import BeautifulSoup html = '<div class="info"> <div class="hd"> <a href="https://movie.douban.com/subject/1292052/" class=""> <span class="title">肖申克的救赎</span> <span class="title"> / The Shawshank Redemption</span> <span class="other"> / 月黑高飞(港) / 刺激1995(台)</span> </a> <span class="playable">[可播放]</span> </div> <div class="bd"> <p class=""> 导演: 罗伯·莱纳 Rob Reiner 主演: 玛德琳·卡罗尔 Madeline Carroll / 卡...<br/> 2010 / 美国 / 剧情喜剧爱情 </p> <div class="star"> <span class="rating45-t"></span> <span class="rating_num" property="v:average">9.1</span>' # 解析 HTML soup = BeautifulSoup(html, 'html.parser') # 提取电影标题 title = soup.find('span', {'class': 'title'}).get_text() # 提取导演、主演、类型和上映时间 info = soup.find('p', {'class': ''}).get_text().strip() director = info.split('导演: ')[1].split(' ')[0] starring = info.split('主演: ')[1].split(' / ')[0] types = info.split('\xa0/\xa0')[1].strip() year = info.split('\n')[2].strip() # 提取评分 rating = soup.find('span', {'class': 'rating_num'}).get_text() # 打印结果 print('电影标题:', title) print('导演:', director) print('主演:', starring) print('类型:', types) print('上映时间:', year) print('评分:', rating) ``` 输出结果为： ``` 电影标题: 肖申克的救赎 / The Shawshank Redemption / 月黑高飞(港) / 刺激1995(台) 导演: 罗伯·莱纳 Rob Reiner 主演: 玛德琳·卡罗尔 Madeline Carroll 类型: 剧情喜剧爱情上映时间: 2010 评分: 9.1 ```

爬取页面中<div class="x_z d_q on"><ul><li></li></ul><div class="g_d"><span class="z_k">展开</span><span class="s_q">收起</span></div></div> 里面的li

你可以使用Python的requests和BeautifulSoup库来爬取页面并提取所需的信息。以下是一个基本的示例代码： ```python import requests from bs4 import BeautifulSoup # 发送请求获取页面内容 url = 'http://example.com' response = requests.get(url) # 解析页面内容 soup = BeautifulSoup(response.text, 'html.parser') li_list = soup.select('div.x_z.d_q.on li') # 打印提取的信息 for li in li_list: print(li.text) ``` 在这个示例中，我们首先发送了一个GET请求来获取页面的内容，并将其传递给BeautifulSoup对象进行解析。我们使用select方法来选择所需的li元素。最后，我们遍历所有选定的li元素并打印其文本内容。

print(url) url = '<span class="rating_num" property="v:average">9.1</span> <span content="10.0" property="v:best"></span> <span>1814630人评价</span>' nums = re.findall(r'<span>\d评价+</span>', str(url), re.S | re.M)怎么去匹配评分人数

爬取页面中<div class="x_z d_q on"><ul><li></li></ul><div class="g_d"><span class="z_k">展开</span><span class="s_q">收起</span></div></div> 里面的li

相关推荐

print(url) url = '<span class="rating_num" property="v:average">9.1</span> <span content="10.0" property="v:best"></span> <span>1814630人评价</span>' nums = re.findall(r'<span>\d评价+</span>', str(url), re.S | re.M)怎么去匹配评分人数

爬取页面中<div class="x_z d_q on"><ul><li></li></ul><div class="g_d"><span class="z_k">展开</span><span class="s_q">收起</span></div></div> 里面的li

相关推荐

Webtest(jsp).rar_Java ODBC SQLSERVER_http/2-class.com/_jsp_试卷_选择

https://acm.timus.ru/print.aspx?space=1&num=1002 题目答案

python中 if __name__ == “__main__”的作用

兰州玖壹壹拍卖有限公司 <o:p></o:p>2022年7月29 日<o:p></o:p> <o:p></o:p> 从这块代码中使用正则表达式的方式 替换数字年月日为新的年月日

兰州玖壹壹拍卖有限公司 <o:p></o:p>2022年7月29 日<o:p></o:p> <o:p></o:p> 从这一段代码中 用正则表达式的方式 提取出来2022年7月29 日<o:p></o:p>这一段代码 然后把这一段代码中的数字年月日替换成今天的日期

嘟嘟熊之父 看过 2023-06-02 14:46:24 北京如何提取其中的a标签中的信息

参考价: 395万如何只取395

来源：河南日报客户端用该方法提取其中的文字

万科四季都会怎么去掉span标签

div class="qml-stem">读一读，猜一猜。什么鸟跑得快，不爱树林爱沙漠？（ ）A. 山椒鸟B. 鸵鸟C. 犀鸟 这段html中使用正则判断是否有选项A

弗兰克·德拉邦特请使用正则

上一页 1 2 3 下一页 点击上一页获取li中带有bluebg属性名的文本

2023-05-24 10:46:38 来源：河南日报客户端 这样的话，你再用该方法提取 来源：河南日报客户端

匹配的字符串

用py写一段代码 12345678…116下一页> 这是我的思路 取所有htm|\"(.*?)</然后输出最大的数

获取 4.8分 中两个span的值,合并在一起

http://www.chinanews.com.cn/cj/2023/06-07/10020478.shtml 2023-06-07 07:24:00 如何将url和时间分别提取出来

最新推荐

基于SSM+JSP的企业人事管理信息系统毕业设计(源码+录像+说明).rar

node-v6.12.0-linux-ppc64le.tar.xz

node-v6.8.0-linux-ppc64le.tar.xz

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

机器学习怎么将excel转为csv文件

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

python中 if name == “main”的作用

兰州玖壹壹拍卖有限公司 <o:p></o:p>2022年7月29 日<o:p></o:p> <o:p></o:p> 从这块代码中使用正则表达式的方式替换数字年月日为新的年月日

兰州玖壹壹拍卖有限公司 <o:p></o:p>2022年7月29 日<o:p></o:p> <o:p></o:p> 从这一段代码中用正则表达式的方式提取出来2022年7月29 日<o:p></o:p>这一段代码然后把这一段代码中的数字年月日替换成今天的日期

嘟嘟熊之父看过 2023-06-02 14:46:24 北京如何提取其中的a标签中的信息

div class="qml-stem">读一读，猜一猜。什么鸟跑得快，不爱树林爱沙漠？（）A. 山椒鸟B. 鸵鸟C. 犀鸟这段html中使用正则判断是否有选项A

上一页 1 2 3 下一页点击上一页获取li中带有bluebg属性名的文本

2023-05-24 10:46:38 来源：河南日报客户端这样的话，你再用该方法提取来源：河南日报客户端

用py写一段代码 1 2 3 4 5 6 7 8…116 下一页> 这是我的思路取所有htm|\"(.*?)</然后输出最大的数

获取 4.8分中两个span的值,合并在一起