特征工程皮尔森相关系数
时间: 2024-06-18 21:04:24 浏览: 255
皮尔逊相关系数
5星 · 资源好评率100%
皮尔森相关系数是用于衡量两个变量之间线性相关程度的统计量,其取值范围在-1到1之间。当取值为1时表示两个变量完全正相关;取值为-1时表示两个变量完全负相关;取值为0时表示两个变量之间没有线性相关性。
在特征工程中,皮尔森相关系数通常被用来进行特征选择。可以通过计算各个特征与目标变量之间的皮尔森相关系数,来选择与目标变量相关性较高的特征作为模型的输入特征。
同时,皮尔森相关系数也可以用于检查特征之间的相关性。在多个特征之间存在强相关性的情况下,可以通过删除其中一个或几个高度相关的特征来降低模型复杂度和提高模型效果。
阅读全文