"机器学习专业课程实验报告：KNN 算法实践与分析"

需积分: 0 104 浏览量更新于2024-01-11 收藏 1.38MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

本次实验报告的主题是KNN算法实践。实验报告的主要内容包括了MNIST数据集、KNN算法原理、KNN算法中的K值选择、KNN算法中的错误分类率以及哈尔滨理工大学计算机科学与技术学院。 1. 引言 1.1 背景在机器学习领域中，KNN算法是一种常用的分类算法。它通过计算待分类样本与训练样本之间的距离，来判断待分类样本属于哪个类别。本次实验将使用KNN算法对MNIST数据集中的手写数字进行分类。 1.2 目的本实验的目的是通过实践掌握KNN算法的原理和应用，在实际数据集上进行分类实验，并对K值选择和错误分类率进行分析。 1.3 实验步骤 1.3.1 数据集介绍使用了MNIST数据集，该数据集包含了大量的手写数字图片及其对应的标签。通过对这些图片进行训练和测试，我们可以对新的手写数字进行分类。 1.3.2 KNN算法原理 KNN算法通过计算待分类样本与训练样本之间的距离，选择K个最近邻样本，并根据这些最近邻样本的标签来对待分类样本进行分类。 1.3.3 K值选择 K值选择是KNN算法中非常重要的一个参数。本次实验通过多次尝试不同的K值，对比其分类结果来选择合适的K值。 1.3.4 KNN算法中的错误分类率错误分类率是评估分类算法性能的重要指标之一。本次实验将通过计算KNN算法中的错误分类率，并与其他K值进行对比分析。 1.3.5 KNN算法在Python中的实现本次实验中，我们使用Python语言对KNN算法进行了实现，并对其进行了测试和调优。 1.4 哈尔滨理工大学计算机科学与技术学院哈尔滨理工大学计算机科学与技术学院是一所高等学府，致力于培养优秀的计算机科学与技术专业人才。 1.5 总结通过本次实验，我们在理论和实践方面都深入了解了KNN算法。我们掌握了KNN算法的原理、K值选择的方法以及错误分类率的计算。同时，我们也了解到了哈尔滨理工大学计算机科学与技术学院在培养计算机科学与技术专业人才方面的努力和成果。总之，本次实验报告详细介绍了KNN算法的实践过程，并总结了实验的结果和经验。通过本次实验，我们对KNN算法有了更深入的理解，并对其在实际应用中的性能进行了评估和分析。此外，我们也对哈尔滨理工大学计算机科学与技术学院表示赞赏，感谢他们在人才培养方面的努力和贡献。

资源详情

资源推荐

1.3.1 读取MNIST数据集

整个实验使⽤numpy与matplotlib库来实现

MINIST的训练集imgNum * rows * cols ⼀共有60000*28*28个像素值

MINIST的测试集imgNum * rows * cols ⼀共有10000*28*28个像素值

这⾥使⽤ numpy 中的 nbarray 类来保存图⽚像素数据以及图⽚label数据

并且使⽤⼆进制打开⽂档，读取⾄缓冲区。注意的是⽂件的前四个整数不是像素数据，⽽是图⽚⽂件的

基础属性。

具体实现过程参考如下代码以及注释

# 读取图⽚

def read_image(file_name):

#先⽤⼆进制⽅式把⽂件都读进来

file_handle=open(file_name,"rb") #以⼆进制打开⽂档

file_content=file_handle.read() #读取到缓冲区中

offset=0

head = struct.unpack_from('>IIII', file_content, offset) # 取前4个整数，返回

⼀个元组

offset += struct.calcsize('>IIII')

imgNum = head[1] #图⽚数

rows = head[2] #宽度

cols = head[3] #⾼度

images=np.empty((imgNum , 784))#empty，是它所常⻅的数组内的所有元素均为空，没有实

际意义，它是创建数组最快的⽅法

image_size=rows*cols#单个图⽚的⼤⼩

fmt='>' + str(image_size) + 'B'#单个图⽚的format

for i in range(imgNum):

images[i] = np.array(struct.unpack_from(fmt, file_content, offset))

offset += struct.calcsize(fmt)

return images #返回图⽚像素数据array

# 读取标签

def read_label(file_name):

file_handle = open(file_name, "rb") # 以⼆进制打开⽂档

file_content = file_handle.read() # 读取到缓冲区中

head = struct.unpack_from('>II', file_content, 0) # 取前2个整数，返回⼀个元组

offset = struct.calcsize('>II')

labelNum = head[1] # label数

bitsString = '>' + str(labelNum) + 'B' # fmt格式：'>47040000B'

label = struct.unpack_from(bitsString, file_content, offset) # 取data数据，

返回⼀个元组

return np.array(label) # 返回图⽚打标array

剩余16页未读，继续阅读

创业青年骁哥

粉丝: 26
资源: 341

"机器学习专业课程实验报告：KNN 算法实践与分析"

DB2实验报告.zip

Project2 实验报告1

Lab2 实验报告1

南京大学pa实验2019文件目录

linux网络编程实验报告

linux shell实验报告

linux多线程实验报告

jsp webchat 实验报告

linux文件操作实验报告

宿舍管理系统实验报告

cisco packet tracer实验报告

实验报告： 在 MySQL 中，

shell编程实验报告

linux实验报告shell编程

linux基础实验报告

python 爬取的实验报告怎么写

linux实验报告总结

大学物理实验报告怎么写

shell程序设计实验报告

最新资源

实验报告：在 MySQL 中，