print(url) url = '<span class="rating_num" property="v:average">9.1</span> <span content="10.0" property="v:best"></span> <span>1814630人评价</span>' nums = re.findall(r'<span>\d评价+</span>', str(url), re.S | re.M)怎么去匹配评分人数
时间: 2023-11-16 16:32:13 浏览: 14
你可以使用正则表达式来匹配评分人数,例如:
```
nums = re.findall(r'<span>\d+人评价</span>', str(url), re.S | re.M)
```
这个正则表达式会匹配类似于 `<span>1814630人评价</span>` 这样的文本,其中 `\d+` 表示匹配一个或多个数字。
相关问题
这个是一个网页解析的我只是复制了一部分</div> <div class="bd"> <p class=""> 导演: 罗伯·莱纳 Rob Reiner 主演: 玛德琳·卡罗尔 Madeline Carroll / 卡...<br/> 2010 / 美国 / 剧情 喜剧 爱情 </p> <div class="star"> <span class="rating45-t"></span> <span class="rating_num" property="v:average">9.1</span>
如果你想提取电影信息和评分,你可以使用 BeautifulSoup 库进行解析,例如:
```
from bs4 import BeautifulSoup
html = '<div class="info"> <div class="hd"> <a href="https://movie.douban.com/subject/1292052/" class=""> <span class="title">肖申克的救赎</span> <span class="title"> / The Shawshank Redemption</span> <span class="other"> / 月黑高飞(港) / 刺激1995(台)</span> </a> <span class="playable">[可播放]</span> </div> <div class="bd"> <p class=""> 导演: 罗伯·莱纳 Rob Reiner 主演: 玛德琳·卡罗尔 Madeline Carroll / 卡...<br/> 2010 / 美国 / 剧情 喜剧 爱情 </p> <div class="star"> <span class="rating45-t"></span> <span class="rating_num" property="v:average">9.1</span>'
# 解析 HTML
soup = BeautifulSoup(html, 'html.parser')
# 提取电影标题
title = soup.find('span', {'class': 'title'}).get_text()
# 提取导演、主演、类型和上映时间
info = soup.find('p', {'class': ''}).get_text().strip()
director = info.split('导演: ')[1].split(' ')[0]
starring = info.split('主演: ')[1].split(' / ')[0]
types = info.split('\xa0/\xa0')[1].strip()
year = info.split('\n')[2].strip()
# 提取评分
rating = soup.find('span', {'class': 'rating_num'}).get_text()
# 打印结果
print('电影标题:', title)
print('导演:', director)
print('主演:', starring)
print('类型:', types)
print('上映时间:', year)
print('评分:', rating)
```
输出结果为:
```
电影标题: 肖申克的救赎 / The Shawshank Redemption / 月黑高飞(港) / 刺激1995(台)
导演: 罗伯·莱纳 Rob Reiner
主演: 玛德琳·卡罗尔 Madeline Carroll
类型: 剧情 喜剧 爱情
上映时间: 2010
评分: 9.1
```
爬取页面中<div class="x_z d_q on"><ul><li></li></ul><div class="g_d"><span class="z_k">展开</span><span class="s_q">收起</span></div></div> 里面的li
你可以使用Python的requests和BeautifulSoup库来爬取页面并提取所需的信息。以下是一个基本的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 发送请求获取页面内容
url = 'http://example.com'
response = requests.get(url)
# 解析页面内容
soup = BeautifulSoup(response.text, 'html.parser')
li_list = soup.select('div.x_z.d_q.on li')
# 打印提取的信息
for li in li_list:
print(li.text)
```
在这个示例中,我们首先发送了一个GET请求来获取页面的内容,并将其传递给BeautifulSoup对象进行解析。我们使用select方法来选择所需的li元素。最后,我们遍历所有选定的li元素并打印其文本内容。