使用scikit-learn实现线性回归算法
时间: 2023-12-08 15:01:24 浏览: 114
Scikit-learn是一个流行的Python机器学习库,提供了许多强大的机器学习算法和工具。要使用scikit-learn实现线性回归算法,首先需要加载数据集。可以使用pandas库加载数据集并进行预处理。然后,使用scikit-learn的线性回归模型来拟合数据。
首先,我们需要导入必要的库:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
```
接下来,我们加载数据集并进行预处理:
```python
data = pd.read_csv('data.csv')
X = data['X'].values.reshape(-1, 1) # 特征
y = data['y'].values # 目标变量
# 把数据集分成训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
```
然后,我们用线性回归模型拟合数据:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
最后,我们可以用测试集来评估模型的表现:
```python
y_pred = model.predict(X_test)
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print('均方误差:', mse)
```
通过scikit-learn实现线性回归算法,我们可以很容易地用几行代码实现一个简单而强大的机器学习模型。这个模型可以用来预测和分析数据集中的趋势和关系。
阅读全文