如何利用Jupyter Notebook从豆瓣API获取并展示前100部电影的基本信息?
时间: 2024-11-06 08:21:32 浏览: 37
要在Jupyter Notebook中通过豆瓣API获取并展示前100部电影的基本信息,你需要遵循以下步骤:
1. **安装必要的库**:
首先,确保你已经安装了`requests`库,用于发送HTTP请求。如果没有,可以在命令行或终端输入 `pip install requests` 来安装。
2. **获取API密钥**:
豆瓣提供了一个开放的API,需要注册账号获取应用key,以便进行后续的访问。访问 https://developers.douban.com/wiki/?title=apikey 注册并获取API key。
3. **编写代码**:
使用Python编写代码,示例如下:
```python
import requests
import pandas as pd
# 替换为你的豆瓣API Key
api_key = 'your_douban_api_key'
base_url = "https://api.douban.com/v2/movie/top250"
# 发送GET请求
response = requests.get(f"{base_url}?apikey={api_key}&start=0&count=100")
# 检查请求是否成功
if response.status_code == 200:
data = response.json() # 解析返回的数据为字典或JSON格式
movies = data['subjects'] # 提取电影数据列表
else:
print("请求失败", response.status_code)
# 将数据转换为pandas DataFrame
movie_df = pd.DataFrame(movies[:100], columns=['id', 'title', 'rate', 'cover_image'])
# 显示前几行数据
movie_df.head()
```
4. **数据清洗与展示**:
如果有需要,对数据进行清洗(如处理缺失值、图片链接等),然后使用pandas提供的各种功能展示数据,例如 `to_string()` 或者使用matplotlib绘制图表。
注意:由于豆瓣API的使用规定,频繁的请求可能会受到限制,因此在实际操作中请确保遵循API的使用策略,并在适当的时候暂停请求间隔。
阅读全文