机器学习与深度学习在Iris数据集上的高精度分类实践

需积分: 0 12 浏览量更新于2024-08-04 1 收藏 529KB DOCX 举报

本文档主要探讨了基于机器学习和深度学习对Iris数据集进行分类的方法，由作者刘林虎在2017年完成。Iris数据集是一个经典的数据集，它源自生物学领域，包含150个样本，分为三个类别：setosa、versicolor和virginica，每个类别各有50个样本，每个样本有四个特征：萼片长度、萼片宽度、花瓣长度和花瓣宽度。这些特征反映了鸢尾花的不同品种特性。实验目标明确，旨在通过这个项目提升对机器学习算法的理解和掌握深度学习框架的应用能力。作者使用Python语言和Scikit-Learn库，进行了K-means、KNN、SVM和逻辑回归等多种机器学习算法的分类尝试。K-means算法在20%的测试集上的准确率为0.7657，而KNN和逻辑回归则分别达到了0.966的较高精度。对于深度学习部分，由于Iris数据集的特点（非图像数据且数量较少），作者选择了Tensorflow框架，尽管通常深度学习更适合处理大规模图像数据。实验中构建了一个2层全连接神经网络，采用softmax分类，并利用梯度下降法进行优化。在服务器上运行，经过40000次迭代后，深度学习方法的准确率同样达到0.966。通过这个项目的实践，作者不仅熟悉了各种机器学习算法，还加深了对Tensorflow框架的理解，强化了数据预处理和模型调优的能力。这个案例展示了如何将理论知识与实际应用相结合，尤其是在数据集规模较小的情况下选择合适的算法和框架进行有效分类。

基于机器学习和深度学习 Iris 数据集的分类

2017Z8009061079 刘林虎

一、数据集

Iris 数据集以鸢尾花的特征作为数据来源，包含 150 个数据，

分为 3 类，每类 50 个数据，每个数据包含 4 个属性，三类分别

为:setosa, versicolor, virginica，数据包含 4 个独立的属性,

这些属性变量测量植物的花朵,比如萼片长度, 萼片宽度,花瓣长

度, 花瓣宽度.

二、实验目标和工具

实验目标：1）熟悉机器学习一般算法。2）学会用深度学习框

架搭建深层网络。

实验工具：1）python 语言，使用 scikit-learn 库。2）使

用 Tensorflow 深度学习框架搭建简单神经网络。

三、机器学习方法

Scikit-Learn 是用 Python 开发的机器学习库，其中包含大量

机器学习算法、数据集，是数据挖掘方便的工具。本实验所有机

器学习算法都是基于 Scikit-Learn 库进行的。代码简单，运行速

度快。

1）用 K-means 分类。将数据集 20%的划分为测试集，用来

测试 K-means 模型。聚类中心 K=3,具体代码请见下图，

最终分类准确率为 0.7657

下载后可阅读完整内容，剩余5页未读，立即下载

实在想不出来了

粉丝: 31
资源: 318

机器学习与深度学习在Iris数据集上的高精度分类实践

1550360012_林虎_物联网工程1班_基于javaSSM的微信点餐系统的设计与实现_论文2

1550360012_林虎_物联网工程1班_基于javaSSM的微信点餐系统的设计与实现_论文1

购物节抽奖小程序（源码）.zip

分享：灵敏度分析.docx

新能源汽车行业：新能源汽车出海进入快车道！-20221108-东吴证券-43页.pdf

具有电流控制的实际_无功功率控制器的两级电压源转换器(VSC)simulink.rar

黑猩猩优化算法Chimp-TCN-LSTM-Multihead-Attention负荷预测Matlab实现.rar

飞利浦14PT165彩电电路原理图.rar

【独家首发】三角测量拓扑聚合优化器TTAO-GMDH锂电池寿命SOC估计【含Matlab源码 7531期】.zip

基于ssm的智能卤菜销售平台设计与实现.docx

最新资源