利用python爬取豆瓣top前10名的电影名字并生成可视化柱状图
时间: 2023-12-18 18:04:47 浏览: 122
好的,以下是一个简单的示例代码,用于爬取豆瓣top前10名的电影,仅输出电影名字,并生成可视化柱状图:
```python
import requests
from bs4 import BeautifulSoup
import matplotlib.pyplot as plt
import numpy as np
url = 'https://movie.douban.com/top250'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有电影条目
movies = soup.select('div.hd')
# 取前10名电影
movies = movies[:10]
# 遍历电影条目并输出电影名称
for i in range(len(movies)):
movie_title = movies[i].a.text.strip()
print(f"{i + 1}. {movie_title}")
# 可视化电影名称
movie_titles = [movie.a.text.strip() for movie in movies]
y_pos = np.arange(len(movie_titles))
plt.bar(y_pos, [1] * len(movie_titles), align='center', alpha=0.5)
plt.xticks(y_pos, movie_titles, rotation='vertical')
plt.ylabel('Count')
plt.title('Top 10 movies on Douban')
plt.show()
```
这段代码首先爬取豆瓣电影排行榜数据,并输出前10名电影的名称。然后使用Matplotlib库生成一个柱状图,用于可视化电影名称。你可以根据需要修改代码以适应其他网站的排行榜和数据。注意:请合法使用网络爬虫,遵守网站的使用条款和robots.txt文件内容。
阅读全文