(2) 合并两个文件,计算每部电影的平均得分是多少(说明:显示结果为movieId,title,平均得分)
时间: 2024-03-02 09:52:25 浏览: 12
假设我们有两个文件:ratings.csv 和 movies.csv。ratings.csv 记录了每个用户对每个电影的评分,movies.csv 记录了每个电影的信息,包括电影ID和电影标题。
我们需要将这两个文件合并,并计算每部电影的平均得分。
以下是一个Python示例代码:
```python
import pandas as pd
# 读取 ratings.csv 文件
ratings = pd.read_csv('ratings.csv')
# 读取 movies.csv 文件
movies = pd.read_csv('movies.csv')
# 合并两个文件
merged = pd.merge(ratings, movies, on='movieId')
# 计算每部电影的平均得分
avg_ratings = merged.groupby(['movieId', 'title'])['rating'].mean().reset_index()
# 显示结果
print(avg_ratings[['movieId', 'title', 'rating']])
```
这段代码首先使用 Pandas 库读取 ratings.csv 和 movies.csv 文件,然后使用 pd.merge() 函数将两个文件按照电影ID合并在一起。接着,使用 groupby() 函数按照 movieId 和 title 分组,并计算每组的平均得分。最后,使用 reset_index() 函数将结果重置索引,并显示 movieId、title 和 rating 三列。