pycharm豆瓣电影250可视化代码并存入csv

好的，下面是代码，可以将豆瓣电影Top250的数据可视化并存入csv文件中： ```python import requests from bs4 import BeautifulSoup import pandas as pd import matplotlib.pyplot as plt # 请求URL url = 'https://movie.douban.com/top250' # 得到页面的内容 def get_page_content(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'} page = requests.get(url, headers=headers).content return page # 解析页面内容，获取电影信息 def parse_page_content(page): soup = BeautifulSoup(page, 'html.parser') movie_list_soup = soup.find('ol', attrs={'class': 'grid_view'}) movie_name_list = [] movie_rating_list = [] movie_info_list = [] for movie_li in movie_list_soup.find_all('li'): detail = movie_li.find('div', attrs={'class': 'hd'}) movie_name = detail.find('span', attrs={'class': 'title'}).getText() movie_rating = movie_li.find('span', attrs={'class': 'rating_num'}).getText() movie_info = detail.find('span', attrs={'class': 'inq'}).getText() if detail.find('span', attrs={'class': 'inq'}) else '' movie_name_list.append(movie_name) movie_rating_list.append(movie_rating) movie_info_list.append(movie_info) return movie_name_list, movie_rating_list, movie_info_list # 爬取豆瓣电影Top250 def get_movie_top250(url): movie_name_list = [] movie_rating_list = [] movie_info_list = [] for i in range(0, 10): page = get_page_content(url + '?start=' + str(i * 25)) movie_name, movie_rating, movie_info = parse_page_content(page) movie_name_list += movie_name movie_rating_list += movie_rating movie_info_list += movie_info # 将数据存入csv文件 data = {'电影名称': movie_name_list, '电影评分': movie_rating_list, '电影简介': movie_info_list} df = pd.DataFrame(data) df.to_csv('douban_movie_top250.csv', index=False, encoding='utf-8-sig') # 数据可视化 plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False plt.figure(figsize=(10, 10)) plt.scatter(movie_rating_list, movie_name_list, s=100) plt.xlabel('电影评分') plt.ylabel('电影名称') plt.title('豆瓣电影Top250') plt.savefig('douban_movie_top250.png', dpi=300) print('豆瓣电影Top250数据已保存到douban_movie_top250.csv，图片已保存到douban_movie_top250.png') if __name__ == '__main__': get_movie_top250(url) ``` 如果想要运行代码，需要安装以下库： - requests - BeautifulSoup - pandas - matplotlib 可使用以下命令安装： ``` pip install requests pip install beautifulsoup4 pip install pandas pip install matplotlib ``` 代码执行完毕后，会在当前目录下生成douban_movie_top250.csv和douban_movie_top250.png文件，分别是豆瓣电影Top250的数据和数据可视化结果。

阅读全文

pycharm豆瓣电影250可视化代码并存入csv

相关推荐

豆瓣电影数据分析及可视化项目使用指南

豆瓣电影爬虫与数据可视化完整Flask-Python源码解析

Python爬虫与Flask实现豆瓣电影数据可视化

基于flask框架的豆瓣TOP250电影数据可视化系统

Python+Pyechart+PyCharm工具实现可视化报表实例

Pycharm软件的可视化数据库插件使用教程.docx

在pycharm上mongodb配置及可视化设置方法

PyCharm MySQL可视化Database配置过程图解

Pycharm官网-重新格式化并重新排列代码.pdf

Pycharm远程连接服务器并实现代码同步上传更新功能

pycharm自动生成个人信息的代码

Pycharm学习教程（2） 代码风格

基于pycharm的图像处理白平衡代码

pycharm使用技巧之自动调整代码格式总结

Pycharm数据库可视化插件使用入门指南

使用PyCharm进行数据分析和可视化

豆瓣电影大数据分析与可视化系统设计

java计算器源码.zip

FRP Manager-V1.19.2

基于优化EKF的PMSM无位置传感器矢量控制研究_崔鹏龙.pdf

大家在看

中国地图九段线shp格式

卷积神经网络在雷达自动目标识别中的研究进展.pdf

SM621G1 BA 手册

IBM小机更换万兆网卡操作说明

基2，8点DIT-FFT，三级流水线verilog实现

最新推荐

在pycharm上mongodb配置及可视化设置方法

PyCharm MySQL可视化Database配置过程图解

pycharm 代码自动补全的实现方法(图文)

Pycharm编辑器功能之代码折叠效果的实现代码

Python爬取股票信息，并可视化数据的示例

PHP集成Autoprefixer让CSS自动添加供应商前缀

揭秘数字音频编码的奥秘：非均匀量化A律13折线的全面解析

arduino PAJ7620U2

网站啄木鸟：深入分析SQL注入工具的效率与限制

【GPStoolbox使用技巧大全】：20个实用技巧助你精通GPS数据处理

Pycharm学习教程（2）代码风格