题目三：采用 scikit-learn 中的 LogisticRegression 逻辑回归模型对非线性数据集进行分类。具体内容：（1）数据集：使用 sklearn 自带数据生成器 make_moons 产生两类数据样本，示例程序如下，参数可自行修改。（2）特征衍生（数据增强）：使用 sklearn 自带 sklearn.preprocessing.PolynomialFeatures 生成指定阶次的多项式特征，从而得到所有多项式组合成的新特征矩阵，degree 参数任选。（3）模型建立：在新特征基础上建立逻辑回归二分类模型。（4）决策边界可视化：绘制决策边界，观察非线性边界的变化。【讨论二】在不加正则项的情况下，改变特征衍生的特征数量（即 degree 参数），观察决策边界的变化情况，以及训练集和测试集分数，体会模型从欠拟合 ->拟合 ->过拟合的过程。提示：可使用 for 循环对不同 degree 进行遍历，观察模型的建模结果。

时间: 2024-02-17 08:01:02 浏览: 20

好的，下面是代码实现： ``` import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import make_moons from sklearn.linear_model import LogisticRegression from sklearn.pipeline import Pipeline from sklearn.preprocessing import PolynomialFeatures from sklearn.model_selection import train_test_split # 生成数据集 X, y = make_moons(n_samples=200, noise=0.1, random_state=1) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1) # 不同阶次的多项式特征 degrees = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] # 绘制决策边界 plt.figure(figsize=(20, 10)) for i, degree in enumerate(degrees): # 创建管道模型 polynomial_logistic_regression = Pipeline([ ("poly_features", PolynomialFeatures(degree=degree)), ("logistic_regression", LogisticRegression(random_state=1)) ]) # 模型训练 polynomial_logistic_regression.fit(X_train, y_train) # 绘制决策边界 plt.subplot(2, 5, i+1) plt.title("Degree {}".format(degree)) plt.scatter(X[:, 0], X[:, 1], c=y, cmap="coolwarm", edgecolors="k") xx, yy = np.meshgrid(np.linspace(-2, 3, 500), np.linspace(-1.5, 2, 500)) Z = polynomial_logistic_regression.predict(np.c_[xx.ravel(), yy.ravel()]) Z = Z.reshape(xx.shape) plt.contourf(xx, yy, Z, cmap="coolwarm", alpha=0.2) plt.xlim(-2, 3) plt.ylim(-1.5, 2) plt.xticks(()) plt.yticks(()) # 输出模型在训练集和测试集上的得分 print("Degree {}: train score: {:.3f}, test score: {:.3f}" .format(degree, polynomial_logistic_regression.score(X_train, y_train), polynomial_logistic_regression.score(X_test, y_test))) plt.show() ``` 这段代码实现了对非线性数据集进行分类，使用了逻辑回归模型，并且通过特征衍生（即数据增强）使用 sklearn.preprocessing.PolynomialFeatures 生成指定阶次的多项式特征，建立了在新特征基础上的逻辑回归二分类模型，并绘制了决策边界，观察非线性边界的变化。同时，在不加正则项的情况下，通过改变特征衍生的特征数量（即 degree 参数），观察决策边界的变化情况，以及训练集和测试集分数，体会模型从欠拟合 ->拟合 ->过拟合的过程。

相关推荐

scikit-learn-examples：使用Scikit-learn探索Logistic回归，MLP和SVM

Python版数据挖掘实验2报告：使用 Scikit-learn中的 K近邻算法进行分类.pdf

Python版数据挖掘实验2报告：使用 Scikit-learn中的 K近邻算法进行分类.docx

编写一个程序，采用 scikit-learn 中的 LogisticRegression 逻辑回归模型对非线性数据集进行分类，要求加入正则项l1，并使数据可视化

编写一个程序，采用 scikit-learn 中的 LogisticRegression 逻辑回归模型对非线性数据集进行分类，完成数据可视化，并输出degree，正则项系数C，正则项种类

用UCI公共测试数据库中澳大利亚信贷批准数据集作为数据集，通过python代码实现分别用线性逻辑回归模型和非线性随机森林模型构建信用卡欺诈的识别模型，运用合适的指标来评价两种模型并分析对比他们的特点

用澳大利亚信贷批准数据集中的690个样本作为数据集，通过python代码分别用线性逻辑回归和非线性随机森林构建识别模型，进行特征选择并用准确度召回率混淆矩阵等指标对结果进行评估

用澳大利亚信贷批准数据集中的690个样本作为数据集，通过python代码分别用线性和非线性识别模型，并用混淆矩阵，准确度召回率等指标对结果进行评估

非线性回归预测模型python

数学建模逻辑回归模型

数学模型逻辑回归python

scikitlearn支持的机器学习算法有哪些

sklearn逻辑斯蒂回归

二元非线性回归Python

python逻辑回归分析

python常用统计模型

最新推荐

yolov5-face-landmarks-opencv

setuptools-0.6c8-py2.5.egg

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

2． 通过python绘制y=e-xsin(2πx)图像

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

导入numpy库，创建两个包含9个随机数的3*3的矩阵，将两个矩阵分别打印出来，计算两个数组的点积并打印出来。（random.randn()、dot（）函数）

2．通过python绘制y=e-xsin(2πx)图像