3、编写代码,分别统计数据文件ratings.csv中的电影总数和评分大于4.0的电影总数(rating列大于4.0),并打印这两个数值,以及4.0分以上电影占比:
时间: 2024-02-22 22:00:11 浏览: 53
基于c语言开发的电影票管理系统源代码,采用csv文件存储数据
以下是使用Python实现的代码:
```python
import pandas as pd
# 读取数据文件
df = pd.read_csv('ratings.csv')
# 统计电影总数
total_movies = len(df['movieId'].unique())
# 统计评分大于4.0的电影总数
high_rating_movies = len(df[df['rating'] > 4.0]['movieId'].unique())
# 计算4.0分以上电影占比
high_rating_movies_ratio = high_rating_movies / total_movies * 100
# 打印统计结果
print("总电影数:", total_movies)
print("评分大于4.0的电影数:", high_rating_movies)
print("4.0分以上电影占比:{:.2f}%".format(high_rating_movies_ratio))
```
注意:代码中假设数据文件名为`ratings.csv`,请根据实际情况修改文件名。
阅读全文