理解和掌握Logistic回归模型,对LogisticRegression类的参数及功能进行解释说明(参考代码3_Otto_train_LR.py)
时间: 2024-05-22 11:11:42 浏览: 78
逻辑回归(Logistics Regression)
Logistic回归模型是一种二元分类模型,主要用于处理二分类问题。在sklearn库中,LogisticRegression类是实现Logistic回归模型的类。下面对LogisticRegression类的主要参数及功能进行解释说明。
1. 参数
(1)penalty:正则化项,取值为l1或l2,默认为l2。
(2)C:正则化强度的倒数,取值为大于0的浮点数,默认为1.0。
(3)fit_intercept:是否需要截距,取值为布尔型,默认为True。
(4)solver:优化算法,取值为newton-cg, lbfgs, liblinear, sag, saga中的一个,默认为liblinear。
(5)max_iter:最大迭代次数,取值为正整数,默认为100。
(6)multi_class:多分类问题的处理方式,取值为ovr或multinomial,默认为ovr。
(7)n_jobs:指定CPU数,-1表示使用全部CPU,默认为1。
2. 功能
(1)fit(X, y):用训练集数据X和标签y拟合模型,训练模型。
(2)predict(X):用训练好的模型预测测试集数据X的标签。
(3)score(X, y):用测试集数据X和标签y计算模型的精度。
(4)intercept_:返回模型的截距。
(5)coef_:返回模型的系数。
(6)get_params():获取模型的参数。
(7)set_params(**params):设置模型的参数。
在代码3_Otto_train_LR.py中,LogisticRegression类的主要使用方式为先用训练集数据和标签拟合模型,然后用测试集数据检验模型的性能。具体实现方式为:
(1)定义LogisticRegression类对象lr,并设置C=1.0,multi_class='ovr'等参数。
(2)用训练集数据和标签拟合模型lr.fit(train_X, train_y)。
(3)用测试集数据预测标签lr.predict(test_X),并计算模型精度lr.score(test_X, test_y)。
阅读全文