Python爬取B站电影排行榜
时间: 2023-12-25 12:30:48 浏览: 24
好的,下面是使用Python爬取B站电影排行榜的代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.bilibili.com/v/popular/rank/movie'
# 发送请求,获取HTML页面
response = requests.get(url)
html = response.text
# 解析HTML页面
soup = BeautifulSoup(html, 'html.parser')
movie_list = soup.find_all('li', class_='rank-item')
# 遍历电影列表,提取信息
for movie in movie_list:
title = movie.find('div', class_='title').text.strip()
play_count = movie.find('div', class_='detail').find_all('span')[0].text.strip()
print(title, play_count)
```
首先,我们导入了requests库和BeautifulSoup库。然后,我们定义了要爬取的B站电影排行榜的URL。接着,我们使用requests库发送GET请求,获取HTML页面的内容。
然后,我们将HTML页面的内容传递给BeautifulSoup库进行解析。我们使用find_all方法找到电影列表。电影列表中的每个电影都被表示为一个li元素,它们的class都是rank-item。
接着,我们遍历电影列表,提取电影的名称和播放量。我们使用find方法找到电影名称和播放量所在的元素,然后使用text属性和strip方法获取它们的内容。最后,我们打印出电影的名称和播放量。
希望这个例子能帮助你理解Python爬取网页的基本方法。