jupter爬取https://www.bilibili.com/v/popular/rank/bangumi/的代码
时间: 2024-10-12 11:17:28 浏览: 53
为了使用Jupyter爬取B站(Bilibili)动画排行榜页面的数据,你可以使用Python的`requests`库获取网页内容,然后配合`BeautifulSoup`解析HTML。下面是一个基本的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 发送GET请求
url = "https://www.bilibili.com/v/popular/rank/bangumi/"
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 找到相关的数据元素,这通常依赖于B站的具体HTML结构
rank_list = soup.find_all('div', class_='rank-list-item') # 这里假设动画排名在class为'rank-list-item'的div元素下
for item in rank_list:
anime_title = item.find('a', class_='title')['title']
anime_rank = item.find('span', class_='num').text.strip()
print(f"标题: {anime_title}, 排名: {anime_rank}")
else:
print("请求失败,状态码:", response.status_code)
```
注意:实际抓取过程中,你需要查看B站网站的源代码确定元素的选择器(如`class`名)。由于网站可能会频繁更改布局,以上代码仅作参考,你可能需要根据最新的HTML结构进行调整。
阅读全文