首页r语言 minimum redundancy–maximum relevance’ (mrmr)

r语言 minimum redundancy–maximum relevance’ (mrmr)

时间: 2023-08-30 19:01:12 浏览: 407

程序_relevance_基于最大相关最小冗余_mrmr_高维数据集属性约简算法_最大最小冗余_源码

5星 · 资源好评率100%

本文主要研究了Minimum -Redundancy Maximum-Relevance(MRMR)的属性约简算法。该算法的思想就是最大化属性子集和类别的相关性，同时最小化属性之间的冗余。本文基于支持向量机（SVM）设计分类器。

'mRMR'是一种常用于特征选择的算法，全称为'minimum redundancy–maximum relevance'，翻译为"最小冗余-最大相关"。它可以在数据集中选取与目标变量相关性高、互相之间相关性低的特征。 'mRMR'算法以两个准则为基础，即最小冗余和最大相关。最小冗余意味着选取的特征之间相互独立，减少重复信息的含量；最大相关则要求选取的特征与目标变量之间有较高的相关性，以保证选取的特征可以很好地预测目标变量。通过综合考虑这两个准则，mRMR算法能够在特征集合中找到最具有价值的特征。在mRMR算法中，首先计算每个特征与目标变量之间的相关性。然后，根据特征之间的互信息（mutual information）计算特征之间的冗余程度。互信息是一种衡量两个随机变量之间非线性关系的度量。 mRMR算法的核心思想是通过求解一个优化问题来找到一个特征子集，使得在这个子集中既存在与目标变量高相关的特征，又不存在冗余信息。这个优化问题可通过贪婪算法或遗传算法等方法来解决。总的来说，mRMR算法是一种有效的特征选择方法，可以帮助提高模型的准确性和解释性。它在数据预处理和特征工程中广泛应用，能够减少噪声特征对模型的负面影响，同时提供最具有预测能力和解释能力的特征子集。

阅读全文