第1关:利用sklearn构建线性回归模型
时间: 2024-09-27 15:02:42 浏览: 110
在Python中,使用Scikit-Learn库构建线性回归模型非常简单。线性回归是一种监督学习算法,主要用于预测连续数值变量。以下是构建基础线性回归模型的步骤:
1. **导入必要的库**:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
```
2. **加载数据**:
假设你有一个CSV文件包含了特征(X)和目标变量(y):
```python
data = pd.read_csv('your_data.csv')
X = data.iloc[:, :-1] # 特征列
y = data.iloc[:, -1] # 目标变量列
```
3. **数据预处理**:
将数据分为训练集和测试集:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. **创建并训练模型**:
```python
model = LinearRegression() # 创建线性回归对象
model.fit(X_train, y_train) # 使用训练数据拟合模型
```
5. **进行预测**:
```python
y_pred = model.predict(X_test) # 预测测试集的结果
```
6. **评估模型性能**:
```python
print(f"Mean Absolute Error (MAE): {metrics.mean_absolute_error(y_test, y_pred)}")
print(f"Mean Squared Error (MSE): {metrics.mean_squared_error(y_test, y_pred)}")
print(f"Root Mean Squared Error (RMSE): {np.sqrt(metrics.mean_squared_error(y_test, y_pred))}")
```
阅读全文