mutual_info_regression的原理
时间: 2023-09-20 16:10:33 浏览: 114
mutual_info_regression是一种特征选择方法,用于回归问题中的特征选择。它基于信息熵原理,衡量特征与目标变量之间的相关性。
具体而言,mutual_info_regression计算每个特征与目标变量之间的互信息(mutual information),互信息表示两个变量之间的相互依赖关系。当两个变量之间的互信息越大,它们之间的相关性就越强。
在mutual_info_regression中,互信息可以通过计算特征与目标变量之间的信息增益来得到。信息增益表示在已知特征的情况下,使用目标变量来预测的不确定性的减少量。因此,特征与目标变量之间的信息增益越大,它们之间的互信息就越大,相关性就越强。
最终,mutual_info_regression将特征按照与目标变量之间的互信息大小进行排序,选择互信息较大的特征作为重要特征。
阅读全文