可视化画出豆瓣电影前10数据的散点图
时间: 2024-03-14 07:47:18 浏览: 87
好的,为了画出豆瓣电影前10数据的散点图,我们需要采集数据并进行处理。这里我使用 Python 语言进行数据采集和处理,使用 matplotlib 库进行画图。
首先,我们需要安装一些必要的 Python 库,包括 requests、pandas 和 matplotlib。你可以在终端或命令行中使用以下命令进行安装:
```
pip install requests pandas matplotlib
```
然后,我们需要编写 Python 代码来采集数据并进行处理和画图。以下是完整的代码:
```python
import requests
import pandas as pd
import matplotlib.pyplot as plt
# 定义要采集的 URL 和请求头
url = 'https://movie.douban.com/j/search_subjects'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 定义请求参数,包括电影类型和数量
params = {
'type': 'movie',
'tag': '热门',
'sort': 'recommend',
'page_limit': '10',
'page_start': '0'
}
# 发送 GET 请求,获取数据
response = requests.get(url, headers=headers, params=params)
data = response.json()['subjects']
# 将数据转换为 Pandas DataFrame 格式
df = pd.DataFrame(data)
# 绘制散点图,横轴为评分,纵轴为评论数量
plt.scatter(df['rate'], df['collect_count'])
# 添加标题和轴标签
plt.title('Top 10 Douban Movies')
plt.xlabel('Rating')
plt.ylabel('Number of Comments')
# 显示图形
plt.show()
```
在以上代码中,我们首先定义了要采集的 URL 和请求头,然后定义了请求参数,包括电影类型和数量。然后,我们发送 GET 请求,获取数据,并将数据转换为 Pandas DataFrame 格式。最后,我们使用 matplotlib 库绘制散点图,并添加标题和轴标签,最后显示图形。
运行以上代码,就可以得到豆瓣电影前10数据的散点图了。
阅读全文