KMeans聚类实验：EEG数据的情感类别与subjectID分析（ARI 0.002）

需积分: 0 17 浏览量更新于2024-08-04 收藏 9.32MB DOCX 举报

本次聚类作业主要探讨了两种常用的聚类算法——KMeans和GaussianMixture在EEG数据集上的应用。该数据集包含533个脑电信号，每个信号由160维特征组成，涵盖了subjectID、videoID、emotioncategory、valence和arousal五个标记。实验目标是理解算法参数如何影响聚类结果，以及聚类结果与原始标签之间的关联。实验过程中，首先对特征数据进行了标准化处理，然后使用KMeans和GaussianMixture分别设置不同的聚类个数，对应于情绪类别（9个）、subjectID（27个）、videoID（20个）以及valence和arousal（各2种）的已知状态。为了减少随机性的影响，每种算法都进行了10次迭代，通过内部指标（如DBI指数、类内误差平均值）和外部指标（调整后的Rand指数，ARI）来评估聚类效果。ARI越大，表示聚类一致性越好，DBI指数和类内误差越小则表明聚类质量越高。 KMeans的实验结果显示，对于emotioncategory，外部指标ARI为0.0020467，这是一个相对较低的值，表明KMeans在此任务中的表现有待提高。内部指标如avgcenterdistance为34.66，DBI为1.50，stress值较大，这可能意味着在2维降维后存在较大的数据点间距离偏差。而SubjectID的聚类性能明显更好，外部指标ARI达到0.7924，内部指标avgcenterdistance较小，显示出在subjectID识别上KMeans的效果较为显著。 GaussianMixture的结果未在文中给出，但从KMeans的部分可以推测，可能需要对比两者在不同指标下的优劣，以便选择最合适的聚类算法。此外，通过MDS（多维尺度）方法将高维数据可视化，有助于直观地理解聚类结果的空间分布和类别间的区分度。总结来说，本实验旨在通过实际操作深入了解聚类算法在复杂EEG数据上的表现，特别是关注算法参数的选择、聚类效果的评估以及不同类别间的区别。同时，它还展示了在处理具有多标签的脑电信号数据时，如何通过多种指标综合评估聚类性能，并优化参数以提升聚类准确性和稳定性。

实验内容：

采用任意 2 个聚类算法对 EEG 数据进行聚类分析，并分析聚类结果:

–算法参数与聚类结果的关系

–聚类结果与其它标签之间的关系等

实验数据：

EEG 数据库，共 533 个脑电信号，每个脑电信号由 160 维特征组成，这些信号

是收集 27 名测试者观察 20 个视频所产生的脑电信号所得，每个信号对应的标

记为观看视频的人 subjectID，视频 videoID，情感类别 emotion category，

valence， arousal，共五种标记。其中 subjectID 有 27 个状态，videoID 有 20

种状态，emotion category 有 9 中状态，valence 有 2 中状态，arousal 有两种状

态。

实验过程：

首先对 533*160 的特征数据进行归一化。然后分别使用 KMeans 和

GaussianMixture 对其进行聚类，设置超参数聚类个数分别为 9，27，20，2，2，

对应已知的五种标记对应的状态数目。

由于两种聚类方法初始均需随机初始化参数或者聚核，所以我们分别进行了十次

实验然后根据内部指标选择最佳的实验结果。

测试聚类效果的时候我们分别采用内部指标与外部指标。外部指标为 adjusted

random index(ARI)。内部指标有所不同，对于 KMeans 我们采用 DBI 指数和类

内误差的平均值，对于 GaussianMixture 我们采用 DBI 指数。其中 ARI 指数越大

越好，DBI 指数越小越好，类内误差的平均值越小越好。同时为了比较聚为不同

类别时的聚类效果，我们利用 MDS 降维方法来进行可视化处理。

实验结果：

----------------KMeans---------------

================1、Emotion Category==================

外部指标 ARI:0.0020467375297614806

内部指标 avg center distance:34.660456271469684

内部指标 DBI：1.5041799557881894

stress(n_components = 2):1079890.2144941238 数据降维时造成的距离的误差

总和

下载后可阅读完整内容，剩余6页未读，立即下载

马克love

粉丝: 40
资源: 319

KMeans聚类实验：EEG数据的情感类别与subjectID分析（ARI 0.002）

大作业成果：C均值聚类方法的显著改进与Matlab实现

MATLAB实现子空间聚类算法大作业源码及使用教程

统计课程大作业：探索文本聚类与算法实践

聚类作业.ipynb

Matlab K均值聚类分析作业.zip_K._k均值聚类_k均值聚类matlab_k均值聚类作业_均值聚类

中科大计算机模式识别聚类作业

中国科学技术大学 中科大模式识别聚类作业 EEG脑电图分析.zip(课设&实训&大作业&竞赛&项目)

Kmeans聚类 期末作业

作业1-SOM聚类_som聚类_

CarDekhoDemo:在谷歌地图上实现聚类的作业

最新资源

中国科学技术大学中科大模式识别聚类作业 EEG脑电图分析.zip(课设&实训&大作业&竞赛&项目)

Kmeans聚类期末作业