Python抓取豆瓣评分并统计,用条形图表示
时间: 2024-04-04 08:34:44 浏览: 63
python抓取网页中图片并保存到本地
好的,我可以为您提供一些指引。首先,您可以使用Python中的requests库和BeautifulSoup库来抓取豆瓣电影的评分信息。具体步骤如下:
1. 使用requests库向豆瓣电影的评分页面发送请求,获取页面内容:
```python
import requests
url = 'https://movie.douban.com/top250'
response = requests.get(url)
```
2. 使用BeautifulSoup库解析页面内容,找到电影的评分信息:
```python
from bs4 import BeautifulSoup
soup = BeautifulSoup(response.text, 'html.parser')
ratings = soup.find_all('span', class_='rating_num')
```
3. 将评分信息存储到一个列表中,并统计每个评分的电影数量:
```python
rating_list = []
for rating in ratings:
rating_list.append(float(rating.text))
rating_count = {}
for rating in rating_list:
if rating in rating_count:
rating_count[rating] += 1
else:
rating_count[rating] = 1
```
4. 使用matplotlib库中的pyplot模块来绘制条形图,并显示图像:
```python
import matplotlib.pyplot as plt
x = list(rating_count.keys())
y = list(rating_count.values())
plt.bar(x, y)
plt.xlabel('Rating')
plt.ylabel('Movie Count')
plt.show()
```
以上就是抓取豆瓣评分信息并绘制条形图的基本步骤。您可以根据自己的需求对代码进行修改和完善。
阅读全文