python电影评分预测代码
时间: 2023-07-23 19:25:57 浏览: 225
下面是一个简单的Python代码示例,使用线性回归来预测电影评分。请注意,这只是一个基本的模型,您可能需要更多的特征和数据来构建更准确的预测模型。
```python
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
# 读取数据集
data = pd.read_csv('movie_data.csv')
# 定义特征和目标变量
X = data[['budget', 'runtime', 'cast_size']]
y = data['rating']
# 将数据集拆分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 训练模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测测试集评分
y_pred = model.predict(X_test)
# 输出评分预测结果
for i in range(len(y_pred)):
print("预测评分: {:.2f}, 实际评分: {:.2f}".format(y_pred[i], y_test.iloc[i]))
```
在上面的代码中,我们首先从CSV文件中读取电影数据,然后选择三个特征(电影的预算,时长和演员数量)作为我们的预测变量,并将电影评分设置为目标变量。然后,我们将数据集拆分为训练集和测试集(在这里我们使用了80/20的比例),并使用线性回归模型对训练集进行拟合。最后,我们使用模型来预测测试集中的评分,并将预测结果与实际评分进行比较。
阅读全文