多元线性回归代码【举例
时间: 2024-06-13 17:02:11 浏览: 165
多元线性回归代码.zip
多元线性回归是一种统计模型,用于预测因变量(也称响应变量)如何依赖于一个或多个自变量(也称特征变量)。在Python中,我们可以使用`sklearn`库中的`LinearRegression`类来进行多元线性回归。下面是一个简单的例子:
```python
# 导入所需的库
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
import pandas as pd
# 假设你有一个名为'data.csv'的数据集
data = pd.read_csv('data.csv')
# 定义特征和目标变量
X = data[['feature1', 'feature2', 'feature3']] # 输入特征
y = data['target'] # 目标变量
# 划分数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建并训练线性回归模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测
y_pred = model.predict(X_test)
# 评估模型性能
print("Mean Absolute Error:", metrics.mean_absolute_error(y_test, y_pred))
print("Mean Squared Error:", metrics.mean_squared_error(y_test, y_pred))
print("Root Mean Squared Error:", np.sqrt(metrics.mean_squared_error(y_test, y_pred)))
# 示例相关问题:
1. 除了`LinearRegression`,`sklearn`里还有哪些模型可用于多元线性回归?
2. 如何处理数据集中的缺失值或异常值对多元线性回归的影响?
3. 在实际项目中,如何选择合适的特征来提高回归模型的准确性?
阅读全文