多元线性回归python模型
时间: 2024-09-24 15:15:12 浏览: 60
多元线性回归是一种统计学方法,用于研究两个或更多自变量与一个因变量之间的线性关系。在Python中,我们可以使用scikit-learn库中的`LinearRegression`类来建立和训练多元线性回归模型。以下是创建和使用这个模型的基本步骤:
1. 导入所需库:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
```
2. 加载数据并预处理:
```python
data = pd.read_csv('your_data.csv') # 替换为你的数据文件路径
X = data.drop('target_column', axis=1) # 'target_column'是你要预测的因变量
y = data['target_column']
```
3. 划分训练集和测试集:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 创建模型并拟合:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
5. 预测和评估:
```python
y_pred = model.predict(X_test)
print("Mean Absolute Error:", metrics.mean_absolute_error(y_test, y_pred))
print("Mean Squared Error:", metrics.mean_squared_error(y_test, y_pred))
print("Root Mean Squared Error:", np.sqrt(metrics.mean_squared_error(y_test, y_pred)))
```
阅读全文