KFST特征提取优化的KNN算法提升分类准确率

需积分: 11 178 浏览量更新于2024-08-12 收藏 147KB PDF 举报

"这篇论文是2008年由陈振洲和邹丽珊发表在华南师范大学学报(自然科学版)上的，属于自然科学领域的研究。文章提出了一种基于核Foley-Sammon变换（KFST）特征提取的KNN（K-最近邻）算法，旨在提高分类准确率。通过KFST进行特征提取，并根据特征提取顺序赋予权重，然后应用KNN算法进行分类。实验结果显示，KNNKFST算法在多数情况下显著提高了分类效果。关键词包括核Foley-Sammon变换、K-近邻算法、距离加权和特征加权。" 详细解释： K-最近邻算法（KNN）是一种监督学习方法，用于分类和回归问题。其基本思想是将未知类别的样本归类到与其最近的K个已知类别样本中的多数类别。KNN算法简单易用，但对特征的选择和距离度量敏感，可能导致分类性能下降。核Foley-Sammon变换（KFST）是一种非线性映射技术，它扩展了原始特征空间，使得数据在新空间中的分布更容易进行分类。KFST是Foley-Sammon变换的核版本，能够处理非线性可分数据，从而在特征提取过程中增强分类能力。在论文中，作者首先利用KFST将原始数据转换到一个新的高维特征空间，这个转换有助于暴露数据的潜在结构。然后，根据特征被提取的顺序为每个特征分配权重，这可能是基于特征的重要性或与目标变量的相关性。这种特征加权策略可以进一步优化KNN算法的性能，因为它允许算法更关注那些对分类影响较大的特征。实验部分，作者对比了标准KNN算法与KNNKFST算法的分类结果，证明了新提出的算法在大多数情况下能显著提高分类准确率。这表明结合KFST的特征提取和特征加权策略有效地改善了KNN在处理复杂数据集时的能力。这篇论文为非线性数据的分类提供了一个新的方法，即结合了非线性变换和特征加权的KNN算法，这对于理解和改进机器学习模型在实际问题中的表现具有重要意义。这一工作对于处理高维度、非线性数据的领域，如图像识别、文本分类等，提供了有价值的理论和技术支持。

2008年 5月

M ay 2008

       

华南师范大学学报 (自然科学版 )

JOURNAL OF SOUTH CH INA NO RMAL UN IVERS ITY

( NATURAL SC IENCE ED ITION )

      

2008年第 2期

 N o. 2, 2008

收稿日期: 2007- 11- 20

作者简介: 陈振洲 ( 1974 - ), 男, 湖南邵阳人, 博士, 华南师范大学讲师, Em ai:l chenzhenzhou@ scnu. edu. cn.

文章编号: 1000- 5463( 2008) 02- 0050- 06

基于 KFST特征提取的 KNN 算法

陈振洲

, 邹丽珊

( 1. 华南师范大学计算机学院, 广东广州 510631; 2. 广州城市职业学院计算机工程系, 广东广州 510405)

摘要: 提出了基于 KF ST ( 核 F o ley- Samm on变换 )特征提取的 KNN 算法 ( KNN

KF ST

): 首先利用 KFST

来提取特征, 然后在按照特征被提取的先后关系赋权重, 再利用 KNN 算法进行分类. 实验表明,

KNN

KFST

能够在大多数情况下极大地提高分类准确率.

关键词: 核 Fo ley- Sammon变换; K - 近邻算法; 距离加权; 特征加权

中图分类号: TP301   文献标识码: A

KNN ALGOR ITHM BASED ON FEATURES EXTRACTED BY K FST

CHEN Zhen- zhou

, ZOU L i- shan

( 1. Schoo l ofC om pu ter, Sou th Ch ina Norm al U n iversity, Guangzhou 510631, Ch in a;

2. D epartm en t of C ompu ter E ngineering, Co llege of Gu angzhou C ity Polytechn ic, Gu angzhou 510405, C hina)

Abstract: A lgorithm KNN

KF ST

( K - N earest Ne ighbor based on features ex tracted by K ernel

Fo ley - Sammon T ranform ) w as proposed in this paper. Firs,t Kernel F oley - Samm on

Tranform w as used to ex tract features for datase.t T hen, the w eight of features w as assigned

acco rd ing to the order o f the ex tracted features. Experim ents on artific ial and natural data

sets KNN

KF ST

show ed tha,t in m ost cases, KNN

KF ST

im proves the accuracy of c lassif ication.

Key w ord s: K ernel Fo ley- Samm on T ranfo rm; K - nearest neighbor; d istance- w e ighted;

feature- w e igh ted

  COVER和 HART

[ 1]

提出的 K - 近邻法 ( KNN )已经成为一种非常有效的非参数分类算法.

对于最优的 K 值, KNN 分类器提供了很好的分类性能. 可以看出, 如果 K 无限大, KNN 分类

规则就变成了 Bayes最优分类规则

[ 2]

. 对 KNN 算法的一个明显的改进是对 K 个近邻的贡献

加权 (距离加权 KNN 算法 )

[ 3]

, 将较大的权值赋给较近的近邻    它对训练数据中的噪声有

很好的健壮性, 而且当给定足够大的训练集合时也非常有效.

应用 KNN 算法的一个实践问题是维度灾难 ( curse o f dim ensionality )问题    由于样本的

距离是根据样本的所有特征 (属性 )计算的, 这样近邻间的距离可能会被大量的不相关特征所

支配, KNN 算法最近邻方法对该问题特别敏感. 同时对于各类样本的边界是线性不可分以及

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38666697

粉丝: 4
资源: 895

KFST特征提取优化的KNN算法提升分类准确率

KFST:一个用于在不同研究领域执行特征选择过程的开源工具

白色大气风格的建筑商业网站模板下载.rar

面向对象编程语言Objective-C基础语法详解及应用

球馆预约系统ssm.zip

STM32F030单片机串口2发送接收.zip

廖鹏盛 - 时代进行曲.zip

白色大气风格的人体艺术摄影网站模板下载.zip

白色大气风格的服装设计师模板下载.zip

白色大气风格的景观设计HTML网站模板.zip

(176226648)机器学习领域，基于TensorFlow与mnist数据集，实现手写数字识别，手写数字识别，机器学习学习首选项目

最新资源