任务:学习经典聚类算法、⼯程实现、结果分析 数据集:⼿写数字图像数据集MNIST 数据处理:为每⼀类随机挑选100个图像,共1000个; 将图像拉伸为⼀个向量; 将每个数据归⼀化处理。 要求:KMEANS算法(K=10)和DBSCAN算法 结果分析: 跟真实类别对⽐,展示⾄少1个不正确的结果,猜测原因 计算带矫正的互信息(AMI)和翦影值(silhouette 【将这段描述转为详细的实验要求】
时间: 2023-06-10 16:06:55 浏览: 93
FCMClust.rar_c均值聚类_模糊C均值_模糊C均值聚类_模糊聚类_聚类数据集
实验要求如下:
1. 数据集:使用MNIST手写数字图像数据集,从每一类中随机选择100个图像,共1000个。将图像拉伸为一个向量,并进行归一化处理。
2. 实现算法:使用经典聚类算法K-Means(K=10)和DBSCAN算法进行聚类。
3. 结果分析:与真实类别进行对比,展示至少一个不正确的结果,并猜测原因。计算带矫正的互信息(AMI)和翦影值(silhouette)。
具体实验步骤如下:
1. 数据预处理:从MNIST数据集中随机选择100个图像,共1000个。将每个图像拉伸为一个向量,并进行归一化处理。
2. 实现K-Means算法:使用K-Means算法对处理后的数据进行聚类,设置K值为10。
3. 实现DBSCAN算法:使用DBSCAN算法对处理后的数据进行聚类。需要注意的是,DBSCAN算法需要调整参数,如eps和min_samples等。
4. 结果分析:将聚类结果与真实类别进行对比,展示至少一个不正确的结果,并猜测原因。
5. 计算AMI和silhouette:使用sklearn.metrics库中的adjusted_mutual_info_score和silhouette_score函数计算带矫正的互信息(AMI)和翦影值(silhouette)。
6. 结果可视化:将聚类结果可视化展示,可以使用t-SNE或PCA进行降维处理。
阅读全文