写出Python爬虫爬取豆瓣top250数据可视化代码

时间: 2023-11-21 10:45:39 浏览: 125

基于python的豆瓣Top250爬虫数据分析可视化（期末大作业）.zip

5星 · 资源好评率100%

当然，以下是Python爬虫爬取豆瓣Top250电影数据并进行可视化的代码： ``` import requests from bs4 import BeautifulSoup import pandas as pd import numpy as np import matplotlib.pyplot as plt def get_html(url): try: user_agent = 'Mozilla/5.0' headers = {'User-Agent': user_agent} r = requests.get(url, headers=headers) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return "" def get_movie_info(html): soup = BeautifulSoup(html, 'html.parser') movie_list = soup.find('ol', attrs={'class': 'grid_view'}) movie_names = [] movie_ratings = [] movie_votes = [] for movie_item in movie_list.find_all('li'): movie_name = movie_item.find('span', attrs={'class': 'title'}).get_text() movie_names.append(movie_name) movie_rating = float(movie_item.find('span', attrs={'class': 'rating_num'}).get_text()) movie_ratings.append(movie_rating) movie_vote = movie_item.find(text= '\n \n (人评价)\n ') movie_vote = int(movie_vote.split('\n')[0].strip()) movie_votes.append(movie_vote) return movie_names, movie_ratings, movie_votes def draw_top_250_chart(movie_names, movie_ratings, movie_votes): # create dataframe df_movies = pd.DataFrame({'电影名称': movie_names, '电影评分': movie_ratings, '观众人数': movie_votes}) # sort by rating df_movies = df_movies.sort_values(by=['电影评分'], ascending=False) # top 30 rating movies top30 = df_movies.head(30) top30 = top30.iloc[::-1] # reverse sort order y_pos = np.arange(len(top30['电影名称'])) # draw chart fig, ax = plt.subplots(figsize=(10, 10)) ax.barh(y_pos, top30['电影评分'], xerr=0.2, align='center', color='blue', ecolor='black') ax.set_yticks(y_pos) ax.set_yticklabels(top30['电影名称']) ax.invert_yaxis() # labels read top-to-bottom ax.set_xlabel('电影评分') ax.set_title('豆瓣Top250高分电影评分排名') # top 30 voted movies top30 = df_movies.sort_values(by=['观众人数'], ascending=False).head(30) top30 = top30.iloc[::-1] # reverse sort order y_pos = np.arange(len(top30['电影名称'])) # draw chart fig, ax = plt.subplots(figsize=(10, 10)) ax.barh(y_pos, top30['观众人数'], xerr=0.2, align='center', color='blue', ecolor='black') ax.set_yticks(y_pos) ax.set_yticklabels(top30['电影名称']) ax.invert_yaxis() # labels read top-to-bottom ax.set_xlabel('观众人数') ax.set_title('豆瓣Top250高分电影观众人数排名') plt.show() if __name__ == "__main__": top250_url = 'https://movie.douban.com/top250' top250_html = get_html(top250_url) movie_names, movie_ratings, movie_votes = get_movie_info(top250_html) draw_top_250_chart(movie_names, movie_ratings, movie_votes) ``` 这段代码将会从豆瓣网站爬取Top250电影数据，并利用matplotlib进行可视化。希望这可以帮助您！

阅读全文

写出Python爬虫爬取豆瓣top250数据可视化代码

相关推荐

python爬虫豆瓣电影Top250数据分析与可视化（应用Flask框架、Echarts、WordCloud等技术）.zip

豆瓣Top250数据爬取及可视化

用python爬虫爬取豆瓣电影top250的信息

使用python爬虫爬取豆瓣电影top250的数据，并存入信息到excel和数据库.zip

Python爬虫爬取豆瓣电影实例

用python创建爬虫爬取豆瓣top250中所有电影的电影名并存入mysql数据库中，并通过Django框架搭建一个网

利用python爬虫爬取豆瓣电影信息

python 爬虫 爬取豆瓣电影与影评

python 爬虫爬取豆瓣读书信息.zip

爬虫爬取豆瓣电影TOP250源代码

基于python爬取豆瓣电影Top250数据分析与可视化源码+文档说明

Python爬虫实例-爬取豆瓣Top250-保存为表格

基于python爬取豆瓣电影Top250数据分析与可视化源码+文档报告PDF

python爬虫 豆瓣电影Top250数据分析与可视化

Python爬取豆瓣top250电影数据，并导入MySQL，写入excel

python 爬虫爬取京东商城商品数据的相关代码，附带数据库存储.zip

基于Python爬取豆瓣电影top250部 使用flask框架可视化数据

热门电影影评数据爬取_爬虫python_爬取数据_爬取豆瓣影评_数据爬虫_python爬虫_

Python scrapy爬取豆瓣电影top250

最新推荐

Python爬取数据并实现可视化代码解析

Python爬虫爬取电影票房数据及图表展示操作示例

python实现网络爬虫 爬取北上广深的天气数据报告 python.docx

Python爬取股票信息，并可视化数据的示例

【Python】豆瓣电影TOP250数据规律分析（Pearson相关系数、折线图、条形图、直方图）

Java毕业设计项目：校园二手交易网站开发指南

管理建模和仿真的文件

【MVC标准化：肌电信号处理的终极指南】：提升数据质量的10大关键步骤与工具

能否提供一个在R语言中执行Framingham数据集判别分析的详细和完整的代码示例？

Blaseball Plus插件开发与构建教程

python 爬虫爬取豆瓣电影与影评

python爬虫豆瓣电影Top250数据分析与可视化

基于Python爬取豆瓣电影top250部使用flask框架可视化数据

python实现网络爬虫爬取北上广深的天气数据报告 python.docx