pycharm爬取豆瓣电影250可视化代码并存入csv

时间: 2023-07-19 21:42:24 浏览: 153

python爬虫豆瓣电影Top250数据分析与可视化（应用Flask框架、Echarts、WordCloud等技术）.zip

好的，下面是完整的爬取豆瓣电影Top250并可视化的代码，并将数据存入csv文件中： ```python import requests from bs4 import BeautifulSoup import pandas as pd import matplotlib.pyplot as plt # 请求URL url = 'https://movie.douban.com/top250' # 得到页面的内容 def get_page_content(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'} page = requests.get(url, headers=headers).content return page # 解析页面内容，获取电影信息 def parse_page_content(page): soup = BeautifulSoup(page, 'html.parser') movie_list_soup = soup.find('ol', attrs={'class': 'grid_view'}) movie_name_list = [] movie_rating_list = [] movie_info_list = [] for movie_li in movie_list_soup.find_all('li'): detail = movie_li.find('div', attrs={'class': 'hd'}) movie_name = detail.find('span', attrs={'class': 'title'}).getText() movie_rating = movie_li.find('span', attrs={'class': 'rating_num'}).getText() movie_info = detail.find('span', attrs={'class': 'inq'}).getText() if detail.find('span', attrs={'class': 'inq'}) else '' movie_name_list.append(movie_name) movie_rating_list.append(movie_rating) movie_info_list.append(movie_info) return movie_name_list, movie_rating_list, movie_info_list # 爬取豆瓣电影Top250 def get_movie_top250(url): movie_name_list = [] movie_rating_list = [] movie_info_list = [] for i in range(0, 10): page = get_page_content(url + '?start=' + str(i * 25)) movie_name, movie_rating, movie_info = parse_page_content(page) movie_name_list += movie_name movie_rating_list += movie_rating movie_info_list += movie_info # 将数据存入csv文件 data = {'电影名称': movie_name_list, '电影评分': movie_rating_list, '电影简介': movie_info_list} df = pd.DataFrame(data) df.to_csv('douban_movie_top250.csv', index=False, encoding='utf-8-sig') # 数据可视化 plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False plt.figure(figsize=(10, 10)) plt.scatter(movie_rating_list, movie_name_list, s=100) plt.xlabel('电影评分') plt.ylabel('电影名称') plt.title('豆瓣电影Top250') plt.savefig('douban_movie_top250.png', dpi=300) print('豆瓣电影Top250数据已保存到douban_movie_top250.csv，图片已保存到douban_movie_top250.png') if __name__ == '__main__': get_movie_top250(url) ``` 如果想要运行代码，需要安装以下库： - requests - BeautifulSoup - pandas - matplotlib 可使用以下命令安装： ``` pip install requests pip install beautifulsoup4 pip install pandas pip install matplotlib ``` 代码执行完毕后，会在当前目录下生成douban_movie_top250.csv和douban_movie_top250.png文件，分别是豆瓣电影Top250的数据和数据可视化结果。

阅读全文

pycharm爬取豆瓣电影250可视化代码并存入csv

相关推荐

python爬取豆瓣top250电影

PycharmProjects:pymysql爬取豆瓣top250电影

在pycharm爬取豆瓣top250

pycharm爬取51job网站

pycharm爬取加数据可视化啊

如何通过pycharm爬取数据

pycharm爬取数据在哪里看

Scrapy爬虫框架教程（二）-- 爬取豆瓣电影TOP250

爬取豆瓣电影源代码数据-项目实战7-爬取源代码数据-ipynb格式-Python语法-用Jupyter notebook打开

Scrpay爬虫框架爬取豆瓣TOP250示例源码

python爬取豆瓣电影(requests模块)

在pycharm上mongodb配置及可视化设置方法

Python爬取猫眼电影数据及可视化

基于Python在招聘网站职位需求爬取、分析及可视化研究LW

爬虫课设~爬取当当图书畅销榜.rar pycharm页面代码、爬取的csv文件、答辩PPT、Word文档很齐全.zip

Scrapy初学者教程：爬取豆瓣Top250评分

Python豆瓣电影数据爬取及可视化分析系统设计

Python爬虫与Flask实现豆瓣电影数据可视化

使用PyCharm进行数据分析和可视化

最新推荐

在pycharm上mongodb配置及可视化设置方法

PyCharm MySQL可视化Database配置过程图解

Python爬取股票信息，并可视化数据的示例

pycharm 代码自动补全的实现方法(图文)

Java毕业设计项目：校园二手交易网站开发指南

管理建模和仿真的文件

【MVC标准化：肌电信号处理的终极指南】：提升数据质量的10大关键步骤与工具

能否提供一个在R语言中执行Framingham数据集判别分析的详细和完整的代码示例？

Blaseball Plus插件开发与构建教程

"互动学习：行动中的多样性与论文攻读经历"