XGB-PCCS与XGB-SBS: 高光谱与LiDAR特征选择的高效算法比较

2 下载量 48 浏览量 更新于2024-08-27 收藏 5.55MB PDF 举报
本文主要探讨了在地物分类任务中,如何有效解决机载激光雷达(LiDAR)与高光谱影像数据融合过程中面临的特征维数过高问题。研究者提出了两种创新的特征选择算法:一种是基于XGBoost(极端梯度提升决策树)与皮尔逊相关系数(Pearson Correlation Coefficient, PCC)相结合的特征选择算法,命名为XGB-PCCS;另一种则是将XGBoost与序列后向选择(Sequential Backward Selection, SBS)相结合的算法,称为XGB-SBS。 XGB-PCCS算法通过利用XGBoost的强健分类性能和PCC来衡量特征与目标变量之间的线性相关性,从而筛选出最相关的特征,降低了模型对冗余或不重要的特征的依赖。这种方法在保持较高分类准确率的同时,显著减少了特征维度,如在实验中,XGB-PCCS保留了25个特征,使得总体分类精度达到95.55%,Kappa系数为0.942,这表明其在减少计算复杂性和提高效率方面表现出色。 相比之下,XGB-SBS则采用逐步剔除特征的方法,每一步都选择对模型影响最小但又有贡献的特征,最终保留了33个特征,总体分类精度为95.63%,Kappa系数为0.943,虽然特征数量稍多,但依然展示了其在特征选择上的优势。然而,XGB-PCCS算法的人为干预程度较低,意味着其在自动化特征选择方面具有更好的可扩展性和实用性。 作者还对这两种算法提取的特征子集进行了对比分析,发现共有24种特征在LiDAR点云和高光谱影像的多模态特征构造中具有较高重要性。这些特征的选择对于后续的地物分类和数据分析至关重要,它们能够提供关键的信息,帮助提高模型的稳定性和准确性。 本文的研究成果为机载激光雷达与高光谱影像的特征选择提供了有效的策略,有助于减少特征维度、优化模型性能,并且为遥感领域的多模态数据处理提供了一种实用的工具。这对于大规模地理空间数据处理和理解具有实际应用价值。