sklearn线性回归函数
时间: 2024-09-05 14:03:04 浏览: 53
sklearn+python:线性回归案例
Scikit-learn(简称`sklearn`)是Python的一个强大的机器学习库,它提供了许多用于数据挖掘和数据分析的工具。在线性回归方面,`sklearn`中的`linear_model`模块提供了线性回归的实现,其中包括`LinearRegression`类。
`LinearRegression`类用于拟合线性模型,以找到一组输入变量和输出变量之间的最佳拟合直线。简单来说,它通过最小化误差的平方和来寻找最合适的线性模型。使用`LinearRegression`类进行线性回归的基本步骤通常包括:实例化模型、使用`fit`方法进行模型拟合以及使用`predict`方法进行预测。
下面是一个简单的使用例子:
```python
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 假设X是特征数据,y是目标变量
X = [[1], [2], [3], [4]]
y = [2, 4, 6, 8]
# 创建线性回归模型实例
model = LinearRegression()
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 训练模型
model.fit(X_train, y_train)
# 预测测试集的结果
y_pred = model.predict(X_test)
# 计算模型的均方误差
mse = mean_squared_error(y_test, y_pred)
print("均方误差:", mse)
```
在这个例子中,我们首先从`sklearn.linear_model`导入`LinearRegression`类,然后创建一个线性回归模型实例。接着,我们将数据集分为训练集和测试集,并使用`fit`方法拟合模型。最后,我们用`predict`方法对测试集进行预测,并计算预测结果的均方误差。
阅读全文