(1)用pandas库读取tmdb 5000 movies.csv文件，查看前3行、后2行。 (2)选择列 Budget, ld、 original language、 release date, popularty, fifte, 用pandaspopularity.csv。据预处理模块将缺失值丢弃处理，并导出到新的 (v 文作 Bodn smo le f Bointe (3)利用pandas库重新读取新的数据集 mdb_5000 movies budgt popularty.csv，并选择字段original_language——"en”的所有数据集，导出为文本文件 tmdtb 5000 movies balgt popularity_en.txt,要求数据之间用逗号分隔，每行末尾包含换行符。 (4)读取文本文件 tmdb_5000 _movies_budgt popularity en.txt 并转存到 Excel 文件mdb_5000_movies_budgt_popularity_en.xlsx中。 (5)重新读取文本文件读取文本文件 tmdb_5000_ movies budgt popularity_en.txt,首先按照电影 title升序排序，分别可视化显示2000～2010年发行电影的 Budget. popularity的值，要求每幅图均包括图例、图标题，x轴刻度值为电影title且斜45°显示(为了显示美观，可以将电影title每隔若干个抽样显示)，每幅图曲线颜色分别为红色、绿色；每幅图分别保存为png图片保存，分辨率为400 dpi,png图片命名分别为 movies_en_budget2000_2010.png、movies_en_popularity_2000_2010.png。

时间: 2024-03-02 07:51:33 浏览: 121

很抱歉，作为AI语言模型，我无法为您执行本地文件操作，但我可以给您提供相应的代码： (1) 读取文件并查看前3行、后2行 ```python import pandas as pd df = pd.read_csv('tmdb_5000_movies.csv') print(df.head(3)) print(df.tail(2)) ``` (2) 选择需要的列，处理缺失值并导出为新文件 ```python df = pd.read_csv('tmdb_5000_movies.csv', usecols=['budget', 'id', 'original_language', 'release_date', 'popularity', 'vote_count']) df.dropna(inplace=True) df.to_csv('tmdb_5000_movies_budget_popularity.csv', index=False) ``` (3) 选择"original_language"为"en"的数据集并导出为文本文件 ```python df = pd.read_csv('tmdb_5000_movies_budget_popularity.csv') df_en = df[df['original_language']=='en'] df_en.to_csv('tmdb_5000_movies_budget_popularity_en.txt', index=False, sep=',', line_terminator='\n') ``` (4) 读取文本文件并转存为Excel文件 ```python df = pd.read_csv('tmdb_5000_movies_budget_popularity_en.txt', sep=',') df.to_excel('tmdb_5000_movies_budget_popularity_en.xlsx', index=False) ``` (5) 按照要求分别绘制两幅图并保存为png文件 ```python import matplotlib.pyplot as plt # 提取2000-2010年的数据 df_year = df[df['release_date'].str[:4].astype(int).between(2000, 2010)] # 绘制budget图 df_budget = df_year.sort_values(by='budget') fig, ax = plt.subplots(figsize=(15,8)) ax.plot(df_budget['id'], df_budget['budget'], 'r-') ax.set_xticklabels(df_budget['title'][::20], rotation=45) ax.set_xlabel('Movie Title') ax.set_ylabel('Budget') ax.set_title('Movies Released from 2000 to 2010 - Budget') ax.legend() plt.savefig('movies_en_budget2000_2010.png', dpi=400) # 绘制popularity图 df_popularity = df_year.sort_values(by='popularity') fig, ax = plt.subplots(figsize=(15,8)) ax.plot(df_popularity['id'], df_popularity['popularity'], 'g-') ax.set_xticklabels(df_popularity['title'][::20], rotation=45) ax.set_xlabel('Movie Title') ax.set_ylabel('Popularity') ax.set_title('Movies Released from 2000 to 2010 - Popularity') ax.legend() plt.savefig('movies_en_popularity_2000_2010.png', dpi=400) ```

阅读全文

相关推荐

Python：csv模块与pandas库读取CSV文件对比

Python 3使用Pandas读取和打印CSV文件数据教程

Python pandas库读取.xlsx文件教程

用 pandas 库读取“tmdb_5000_movies.csv”文件，查看前三行、后两行

用pandas库读取bike _ day.csv文件，查看前5行、后2行。

利用函数用 pandas 库读取“tmdb_5000_movies.csv”文件，查看前三行、后两行

Monthly-report-of-electricity-consumption:Pandas Python程序，允许读取.csv文件，以便推断所需月份的特定客户的用电量数据

解决Python中pandas读取*.csv文件出现编码问题

python的pandas工具包，保存.csv文件时不要表头的实例

使用python的pandas库读取csv文件保存至mysql数据库

怎么利用read_csv读取movies.csv文件

使用pandas库读取csv文件的某一列和某一行

在python输入import os import pandas as pd import numpy as np os.chdir("d://lhfx") TMDB = pd.read_csv('tmdbxls.csv') 运行后为什么没数据

pandas读取csv文件读取2到3列数据

用pandas读取csv文件前五列

pandas读取csv文件，读取指定列

使用Python和Pandas分析titanic.csv数据包

解决pandas读取带中文列标题CSV错误

大家在看

基2，8点DIT-FFT，三级流水线verilog实现

某大型国企信息化项目验收管理办法.pdf

CISP-DSG 数据安全培训教材课件标准版

synopsis dma ip核手册

MRP整体设计.pptx

最新推荐

pandas读取csv文件提示不存在的解决方法及原因分析

解决pandas中读取中文名称的csv文件报错的问题

python pandas读取csv后,获取列标签的方法

Pandas读取csv时如何设置列名

pandas.DataFrame删除/选取含有特定数值的行或列实例

SIM800C模块详细资料汇总

电力电子技术的智能化：数据中心的智能电源管理

stream()变成map集合

Delphi XE5实现Android文本到语音功能教程

如何运用电力电子技术实现IT设备的能耗监控