pandas将对文件movie_metadata.csv中电影信息数据进行清洗和整理,编程统计并输出影片A的上映天数和日平均票房(日平均票房指文件中所有涉及城市的总平均票房)。
时间: 2024-05-09 16:21:55 浏览: 96
好的,你的问题已经记录下来了。关于你的问题,我可以给出以下代码实现:
```python
import pandas as pd
# 读取 movie_metadata.csv 文件中的电影信息数据
movies = pd.read_csv('movie_metadata.csv')
# 对数据进行清洗和整理
movies_cleaned = movies.drop_duplicates(subset='movie_title') # 去重
movies_cleaned = movies_cleaned.dropna() # 去除缺失值
# 统计影片 A 的上映天数和日平均票房
movie_a = movies_cleaned[movies_cleaned['movie_title'] == 'A'] # 筛选出影片 A 的数据
total_days = len(movie_a) # 上映天数
total_box_office = movie_a['gross'].sum() # 总票房
total_cities = len(movie_a['city'].unique()) # 涉及城市数量
avg_box_office_per_day = total_box_office / total_days # 日平均票房
avg_box_office_per_city = total_box_office / total_cities # 城市平均票房
print('影片 A 的上映天数为:', total_days)
print('影片 A 的日平均票房为:', avg_box_office_per_day)
```
该代码会读取 movie_metadata.csv 文件,对其中的电影信息数据进行清洗和整理,并统计影片 A 的上映天数和日平均票房。需要注意的是,以上代码中的变量名和影片名称 A 可能需要根据你的实际情况进行修改。希望可以帮到你!
阅读全文