编程;基于Skit-earn自带的白酒数据集完成机器学习的数据准备工作，并将代码填入答案但中。要求如下 (1)加载Scikit-learn自带的白酒数据集; (2)获取数据集的特征 (X)和标签(Y)，并打印X和Y的大小; (3)将数据集划分为训练集和测试集，并打印训练集和测试集的大小。 (4)选择数据集的两个特征，绘制数据集散点图(scatter) 编程:基于上述加载拆分后的白酒数据集使用对数几率回归(Logistic Regression)进行分类，评估结果，并打印混淆矩阵(confusion matrix)和分类报告(classificationreport)。 (1)初始化对数几率回归模型，使用训练集进行拟合; (2)使用测试集测试分类精度，预测测试数据，并打印结果; (3)打印分类报告。 (4)打印混淆矩阵。提示:对数几率回归所在包sklearn.linear model，混淆矩阵和分类报告所在包:sklearn.metrics 编程:基于自酒数据集，使用朴素贝叶斯方法编程实现如下功能: (1)分别使用高斯朴素贝叶斯和多项式朴素贝叶斯训练数据; (2)打印两个朴素贝叶斯的测试精度; (3)定义分层划分(n splits=50,test size=0.2)，利用学习曲线函数(leaming curve)计算两个方法的测试集大小、训练精度和测试精度，并打印。 (4)分别绘制两种朴素贝叶斯方法的学习曲线。

时间: 2024-02-27 10:59:19 浏览: 153

(1) 加载Scikit-learn自带的白酒数据集: ```python from sklearn.datasets import load_wine wine = load_wine() ``` (2) 获取数据集的特征 X 和标签 Y ，并打印 X 和 Y 的大小: ```python X = wine.data Y = wine.target print('X size:', X.shape) print('Y size:', Y.shape) ``` (3) 将数据集划分为训练集和测试集，并打印训练集和测试集的大小: ```python from sklearn.model_selection import train_test_split X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=42) print('X_train size:', X_train.shape) print('X_test size:', X_test.shape) print('Y_train size:', Y_train.shape) print('Y_test size:', Y_test.shape) ``` (4) 选择数据集的两个特征，绘制数据集散点图(scatter): ```python import matplotlib.pyplot as plt plt.scatter(X[:, 0], X[:, 1], c=Y) plt.xlabel('Feature 0') plt.ylabel('Feature 1') plt.show() ``` 基于上述加载拆分后的白酒数据集使用对数几率回归(Logistic Regression)进行分类，评估结果，并打印混淆矩阵(confusion matrix)和分类报告(classification report): (1) 初始化对数几率回归模型，使用训练集进行拟合: ```python from sklearn.linear_model import LogisticRegression lr = LogisticRegression() lr.fit(X_train, Y_train) ``` (2) 使用测试集测试分类精度，预测测试数据，并打印结果: ```python from sklearn.metrics import accuracy_score Y_pred = lr.predict(X_test) print('Accuracy:', accuracy_score(Y_test, Y_pred)) ``` (3) 打印分类报告: ```python from sklearn.metrics import classification_report print(classification_report(Y_test, Y_pred)) ``` (4) 打印混淆矩阵: ```python from sklearn.metrics import confusion_matrix print(confusion_matrix(Y_test, Y_pred)) ``` 基于自酒数据集，使用朴素贝叶斯方法编程实现如下功能: (1) 分别使用高斯朴素贝叶斯和多项式朴素贝叶斯训练数据: ```python from sklearn.naive_bayes import GaussianNB, MultinomialNB gnb = GaussianNB() mnb = MultinomialNB() gnb.fit(X_train, Y_train) mnb.fit(X_train, Y_train) ``` (2) 打印两个朴素贝叶斯的测试精度: ```python print('GaussianNB accuracy:', gnb.score(X_test, Y_test)) print('MultinomialNB accuracy:', mnb.score(X_test, Y_test)) ``` (3) 定义分层划分(n_splits=50, test_size=0.2)，利用学习曲线函数(learning curve)计算两个方法的测试集大小、训练精度和测试精度，并打印: ```python from sklearn.model_selection import learning_curve train_sizes, train_scores_gnb, test_scores_gnb = learning_curve(GaussianNB(), X, Y, cv=50, train_sizes=np.linspace(0.1, 1.0, 5)) train_sizes, train_scores_mnb, test_scores_mnb = learning_curve(MultinomialNB(), X, Y, cv=50, train_sizes=np.linspace(0.1, 1.0, 5)) print('GaussianNB train_sizes:', train_sizes) print('GaussianNB train_scores:', np.mean(train_scores_gnb, axis=1)) print('GaussianNB test_scores:', np.mean(test_scores_gnb, axis=1)) print('MultinomialNB train_sizes:', train_sizes) print('MultinomialNB train_scores:', np.mean(train_scores_mnb, axis=1)) print('MultinomialNB test_scores:', np.mean(test_scores_mnb, axis=1)) ``` (4) 分别绘制两种朴素贝叶斯方法的学习曲线: ```python plt.plot(train_sizes, np.mean(train_scores_gnb, axis=1), 'o-', color='r', label='GaussianNB training score') plt.plot(train_sizes, np.mean(test_scores_gnb, axis=1), 'o-', color='g', label='GaussianNB test score') plt.plot(train_sizes, np.mean(train_scores_mnb, axis=1), 'o-', color='b', label='MultinomialNB training score') plt.plot(train_sizes, np.mean(test_scores_mnb, axis=1), 'o-', color='y', label='MultinomialNB test score') plt.xlabel('Training examples') plt.ylabel('Score') plt.legend(loc='best') plt.show() ```

阅读全文

相关推荐

TextClassification：基于scikit-learn实现对新浪新闻的文本分类，数据集为100w篇文档，总计10类，测试集与训练集1：1划分。分类算法采用SVM和Bayes，其中Bayes作为基线

skit-todomvc:TodoMVC在短剧中的实现

skit-extensions.js:扩展集

amv-skit-titles:AMV Hell 的短剧

Go-Skit-命令行CLI的基本演示应用程序

skit-react:通过自动预处理.jsx文件将小品与React结合使用的示例

Python库 | skit_calls-0.1.2-py3-none-any.whl

DotNetCore.SKIT.FlurlHttpClient.Wechat-main.zip

Skitter：SPAship的SKIT原型

skit:快速轻松地构建松弛机器人！

Skit-Extensions.js：增强JavaScript内置对象的实用扩展集

skit-react示例：自动预处理.jsx与React服务器端预渲染

用Skit快速搭建Slack聊天机器人

探索Skitter：SPAship的SKIT原型技术实现

Go语言开发Skit：命令行CLI应用基础指南

只使用numpy不调用skit-learn完整实现线性不可分支持向量机六分类，对手动输入的单条18维数据循环训练、保存模型、加载模型、预测

skit.flurlhttpclient 小程序支付 教程

SKIT.FlurlHttpClient.Wechat.Tenpay

SKIT.FlurlHttpClient.Wechat.TenpayV3

大家在看

yolo开发人工智能小程序经验和总结.zip

基于MATLAB的表面裂纹识别与检测

Modbus on AT32 MCU

论文研究-一种面向HDFS中海量小文件的存取优化方法.pdf

Gephi Cookbook 无水印原版pdf

最新推荐

java-servlet-api.doc

《永磁无刷直流电机控制系统与软件综合研究-集成电机计算软件、电机控制器及电磁设计软件的创新设计与实践》,永磁无刷直流电机计算与控制软件：高效电机控制器与电磁设计工具,永磁无刷直流电机计算软件，电机控

新能源汽车VCU开发模型及策略详解：从控制策略到软件设计全面解析,新能源汽车VCU开发模型及策略详解：从控制策略到软件设计全面解析,新能源汽车VCU开发模型及控制策略，MBD电控开发 新能源汽车大势所

Python读取Excel文件的方法详解及应用场景

毕设springboot基于springboot的医护人员排班系统.zip

Spring Websocket快速实现与SSMTest实战应用

电力电子技术的智能化：数据中心的智能电源管理

通过spark sql读取关系型数据库mysql中的数据

新版微软inspect工具下载：32位与64位版本

如何运用电力电子技术实现IT设备的能耗监控

skit.flurlhttpclient 小程序支付教程

新能源汽车VCU开发模型及策略详解：从控制策略到软件设计全面解析,新能源汽车VCU开发模型及策略详解：从控制策略到软件设计全面解析,新能源汽车VCU开发模型及控制策略，MBD电控开发新能源汽车大势所