编写代码,分别统计数据文件ratings.csv中的电影总数和评分大于4.0的电影总数(rating一列大于4.0),并打印这两个数值,以及4.0分以上电影占比:
时间: 2024-02-25 17:58:34 浏览: 144
基于c语言开发的电影票管理系统源代码,采用csv文件存储数据
以下是Python代码实现:
```python
total_movies = 0
high_rating_movies = 0
with open('ratings.csv', 'r') as f:
next(f) # 跳过文件头
for line in f:
fields = line.strip().split(',')
total_movies += 1
if float(fields[2]) > 4.0:
high_rating_movies += 1
print("总电影数:", total_movies)
print("评分大于4.0的电影数:", high_rating_movies)
print("4.0分以上电影占比:{:.2f}%".format(high_rating_movies / total_movies * 100))
```
解释一下代码:
首先,我们打开数据文件ratings.csv,使用 `next(f)` 跳过文件头。
然后,我们遍历文件中的每一行数据,使用 `strip()` 方法去除行末的换行符,再用 `split(',')` 方法将行数据按逗号分割成一个字符串列表。
接下来,我们将电影总数加1。如果列表的第三个元素(即评分)大于4.0,则将评分大于4.0的电影总数加1。
最后,我们打印电影总数、评分大于4.0的电影总数以及4.0分以上电影占比。注意,占比需要乘以100并保留两位小数,可以使用格式化字符串来实现。
阅读全文