多元线性回归模型预测汽车价格
时间: 2023-12-09 16:04:52 浏览: 47
根据引用[1],我们可以使用Python的sklearn库对汽车历史价格信息进行回归分析,建立多元线性回归模型预测汽车价格。具体步骤如下:
1. 数据预处理:包括数据清洗、缺失值处理、标准化等。其中标准化可以使用sklearn库中的StandardScaler()函数。
2. 特征选择:通过特征相关性分析,选择与价格相关性较高的特征作为模型的输入变量。
3. 模型训练:使用sklearn库中的LinearRegression()函数建立多元线性回归模型,并使用训练集对模型进行训练。
4. 模型评估:使用测试集对模型进行评估,可以使用均方误差(MSE)和决定系数(R²)等指标来评估模型的预测效果。
5. 模型预测:使用训练好的模型对新的汽车数据进行价格预测。
下面是一个简单的代码示例:
```python
# 导入必要的库和数据集
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import pandas as pd
data = pd.read_csv('car_data.csv')
# 数据预处理
X = data[['mileage', 'tax', 'mpg', 'engineSize']]
y = data['price']
scaler = StandardScaler()
X = scaler.fit_transform(X)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 建立多元线性回归模型并训练
regressor = LinearRegression()
regressor.fit(X_train, y_train)
# 模型评估
y_pred = regressor.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print('MSE:', mse)
print('R²:', r2)
# 模型预测
new_data = pd.DataFrame({'mileage': [5000], 'tax': [150], 'mpg': [40], 'engineSize': [2.0]})
new_data = scaler.transform(new_data)
price_pred = regressor.predict(new_data)
print('Price prediction:', price_pred)
```