Python爬取B站电影排行榜
时间: 2023-12-25 07:30:52 浏览: 83
用Python爬取豆瓣电影分类排行榜(保存至本地)
好的,我来给你讲一下Python爬取B站电影排行榜的方法。
首先,我们需要用到Python的requests库和BeautifulSoup库。requests库用于发送HTTP请求,BeautifulSoup库用于解析HTML内容。
接下来,我们需要找到B站电影排行榜的URL。可以在浏览器中打开B站电影排行榜页面,然后复制URL。例如:https://www.bilibili.com/v/popular/rank/movie。
然后,我们可以使用requests库发送GET请求获取HTML内容。代码如下:
```python
import requests
url = 'https://www.bilibili.com/v/popular/rank/movie'
response = requests.get(url)
html = response.text
```
接下来,我们需要使用BeautifulSoup库解析HTML内容。我们可以使用find_all方法来获取电影列表。代码如下:
```python
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, 'html.parser')
movie_list = soup.find_all('li', class_='rank-item')
```
现在我们已经获取了电影列表。我们可以遍历列表,提取需要的信息,例如电影名称、播放量等。代码如下:
```python
for movie in movie_list:
title = movie.find('div', class_='title').text.strip()
play_count = movie.find('div', class_='detail').find_all('span')[0].text.strip()
print(title, play_count)
```
这样我们就可以爬取B站电影排行榜的信息了。完整代码如下:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.bilibili.com/v/popular/rank/movie'
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
movie_list = soup.find_all('li', class_='rank-item')
for movie in movie_list:
title = movie.find('div', class_='title').text.strip()
play_count = movie.find('div', class_='detail').find_all('span')[0].text.strip()
print(title, play_count)
```
希望这个例子能帮助你理解Python爬取网页的基本方法。
阅读全文