在逻辑回归模型—交易数据异常检测实验中,讨论用到的两种方法,下采样和过采样,哪种更适合我们的模型?
时间: 2023-06-13 13:02:46 浏览: 118
过采样技术提高ADC分辨率
在逻辑回归模型-交易数据异常检测实验中,下采样和过采样都是解决数据不平衡问题的方法。如果我们的数据集中异常数据的数量比较少,那么可以使用过采样方法;如果异常数据的数量比较多,那么可以使用下采样方法。
具体选择哪种方法更适合取决于数据集的情况以及我们想要关注的指标。过采样可以增加异常数据的数量,提高模型对异常数据的识别能力,但也容易导致过拟合。下采样可以减少正常数据的数量,使得数据更加平衡,但也可能会导致信息损失。
因此,我们可以根据实际情况进行选择,也可以将两种方法结合起来使用,比如先使用过采样增加异常数据的数量,然后再使用下采样减少正常数据的数量。
阅读全文