电影评分预测数据集代码
时间: 2023-10-02 19:12:10 浏览: 186
豆瓣电影评分预测-数据集
5星 · 资源好评率100%
以下是一个使用Python和Pandas库读取和处理电影评分预测数据集的示例代码:
```python
import pandas as pd
# 读取数据集
ratings_df = pd.read_csv('ratings.csv')
# 查看数据集前5行
print(ratings_df.head())
# 获取数据集中的电影数量
num_movies = len(ratings_df['movieId'].unique())
print('电影数量:', num_movies)
# 获取数据集中的用户数量
num_users = len(ratings_df['userId'].unique())
print('用户数量:', num_users)
# 获取每个电影的平均评分
movie_ratings = ratings_df.groupby('movieId')['rating'].mean()
print('每个电影的平均评分:')
print(movie_ratings.head())
# 获取每个用户对电影的评分数量
user_ratings = ratings_df.groupby('userId')['rating'].count()
print('每个用户对电影的评分数量:')
print(user_ratings.head())
```
这个代码示例展示了如何读取数据集文件、计算电影和用户数量、获取每个电影的平均评分以及每个用户对电影的评分数量。你可以根据需要进行修改和扩展。
阅读全文