1.根据原始特征之间的相关系数矩阵R和冗余矩阵D，将其转换为距离矩阵S； 2.初始化每个特征的权值，将其设置为一个较小的正数（如0.01）。 3.对于每个特征i，计算其与目标变量的相关系数，将相关系数最大的特征j加入Z中 4.对于每对特征i和j，计算它们之间的相关系数，并将其乘以它们各自的权值，得到它们的相关度。然后将这些相关度累加到特征i和j的权值上 5.对于第i个特征，计算其与其他特征的相关性和冗余性,表示特征i与其他特征的相关系数的平均值，表示特征i与其他特征冗余度的平均值。将冗余度最小的特征从Z中移除，并将其权值设为0. 6.如果Z中特征数小于k，重复步骤4-6 7.计算第i个特征与其他特征的相关性和冗余性后将其加权求和，得到该特征的得分值，将所有特征的得分值按从大到小排序，选择最高的k个特征来构建子集 8.返回Z. 写出以上每一步需要用到的公式及字母含义并写出完整步骤

时间: 2024-03-30 12:33:33 浏览: 58

这是一个特征选择的算法，叫做相关度量算法（Correlation-based Feature Selection，CFS）。下面是每一步具体的公式和步骤： 1. 将相关系数矩阵 $R$ 和冗余矩阵 $D$ 转换为距离矩阵 $S$： $$S_{i,j} = \sqrt{1 - R_{i,j}} + \sqrt{1 - D_{i,j}}$$ 2. 初始化每个特征的权值，将其设置为一个较小的正数（如0.01）。 3. 对于每个特征 $i$，计算其与目标变量的相关系数，将相关系数最大的特征 $j$ 加入集合 $Z$ 中： $$j = \operatorname*{arg\,max}_{j \notin Z} \left| corr(i, y) \right|$$ 4. 对于每对特征 $i$ 和 $j$，计算它们之间的相关系数，并将其乘以它们各自的权值，得到它们的相关度。然后将这些相关度累加到特征 $i$ 和 $j$ 的权值上： $$s_{i,j} = \sum_{k \in Z} w_k \cdot corr(i,j)$$ 5. 对于第 $i$ 个特征，计算其与其他特征的相关性和冗余性。$r_i$ 表示特征 $i$ 与其他特征的相关系数的平均值，$d_i$ 表示特征 $i$ 与其他特征冗余度的平均值。将冗余度最小的特征从集合 $Z$ 中移除，并将其权值设为0： $$r_i = \frac{\sum_{j \in Z, j \neq i} corr(i,j)}{|Z|-1}$$ $$d_i = \sum_{j \in Z, j \neq i} s_{i,j}$$ $$k = \operatorname*{arg\,min}_{j \in Z} d_j$$ $$Z = Z - \{k\}$$ $$w_k = 0$$ 6. 如果集合 $Z$ 中特征数小于 $k$，重复步骤 4-6。 7. 计算第 $i$ 个特征与其他特征的相关性和冗余性后将其加权求和，得到该特征的得分值。将所有特征的得分值按从大到小排序，选择最高的 $k$ 个特征来构建子集： $$s_i = r_i - \frac{1}{|Z|-1} \sum_{j \in Z, j \neq i} corr(i,j) + \frac{1}{|Z|} \sum_{j \in Z, j \neq i} s_{i,j}$$ $$\operatorname*{sort}_{i=1}^n s_i$$ $$S = \{ i | i \leq k\}$$ 8. 返回集合 $Z$。

相关推荐

混沌序列测量矩阵.rar_bolomb 序列_压缩感知 混沌_压缩感知混沌_混沌_混沌测量矩阵

基于线性无关矩阵的按需解锁硬件混淆方法.docx

基于距离误差的机器人参数辨识模型与冗余性分析.pdf

X=HRsH',H就是两个重叠散射源h1和h2混合在一起的分布函数，Rs是源信号的协方差矩阵，请问我该如何使用NMF求解h1和h2呢

卷积编码（2，1，3）matlab实现

mlp模型每次迁移都使用sffst特征选择，sffs互信息作为评价指标，mrmr作为准则函数。python pytorch代码每行详细解释

用paddle分别实现正交位置编码和相对位置编码

Python的实例化逆运动学库得原理

matlab omp法

pca图像压缩python代码

jerasure库在获取到K块数据后怎么恢复数据，函数调用顺序是什么

邻域粗糙集的属性约简python代码

图论matlab代码整理

优化算法matlab代码

ur5机械臂rrt算法代码

深度学习算法各种优化方法中轻量级网络设计方法

cuda shared memory

基于粗糙集理论的属性约简算法python代码

最新推荐

Java实现求解一元n次多项式的方法示例

TensorFlow实现MLP多层感知机模型

“人力资源+大数据+薪酬报告+涨薪调薪”

java-ssm+vue高校课程评价系统实现源码(项目源码-说明文档)

WebLogic集群配置与管理实战指南

管理建模和仿真的文件

Python列表操作大全：你不能错过的10大关键技巧

编写完整java程序计算"龟兔赛跑"的结果，龟兔赛跑的起点到终点的距离为800米，乌龟的速度为1米／1000毫秒，兔子的速度为1.2米／1000毫秒，等兔子跑到第600米时选择休息120000毫秒，请编写多线程程序计算龟兔赛跑的结果。

AIX5.3上安装Weblogic 9.2详细步骤

"互动学习：行动中的多样性与论文攻读经历"

混沌序列测量矩阵.rar_bolomb 序列_压缩感知混沌_压缩感知混沌_混沌_混沌测量矩阵