社交网络驱动的双知识表达分类技术

需积分: 5 1 下载量 43 浏览量 更新于2024-08-29 收藏 4MB PDF 举报
"基于社交网络的双知识表达分类方法是一种创新的分类技术,它通过挖掘数据风格信息来提升分类性能。该方法由顾苏杭和王士同在《控制与决策》期刊2020年第11期中发表,文章编号为10.13195/j.kzyjc.2019.0141。研究重点在于如何利用社交网络的结构以及KNN算法来捕捉数据点间的组织关系,并识别不同类别数据的风格特征。在分类过程中,这种方法引入双知识表达约束,确保测试样本在物理特性和风格特性上都与分类模型匹配,从而提高分类准确性和适应性。实验结果表明,该方法在包含显著风格的数据集中表现出优于其他对比分类方法的性能,在不包含或风格不明显的数据集上也能达到竞争水平。" 本文提出的分类方法主要包含以下几个关键知识点: 1. **双知识表达**:这是核心概念,指同时考虑数据点的物理特性和数据风格信息进行分类。物理特性是数据本身的属性,如数值、类别等;而数据风格信息则是类别间区别化的特征,可能体现在数据的分布模式、关联规则或其他统计特性上。 2. **社交网络构建**:利用K近邻(KNN)算法构建社交网络,每个数据点被视为网络中的节点,节点间的连接表示它们的相似度。这种网络结构能反映数据点间的内在组织结构,有助于捕捉类别间的潜在关系。 3. **社交网络属性挖掘**:通过分析社交网络的结构和属性,可以挖掘出数据点的风格信息。这一步可能涉及到社区检测、节点影响力分析等社交网络分析技术,以便识别类别特有的风格模式。 4. **分类阶段的双知识约束**:在分类过程中,不仅要求测试样本与分类模型在物理特性上接近,还要求其风格特性与模型匹配。这种双重约束提高了分类的全面性和准确性,特别是在处理具有显著风格差异的数据时。 5. **性能比较与验证**:通过对多种数据集的实验,验证了该方法的有效性。在没有显著风格信息或风格信息不明显的数据集上,方法的性能与其他分类算法相当;而在有明显风格的数据集上,则显示出更优的分类效果。 6. **应用领域**:尽管该方法是在社交网络背景下提出的,但其思想和方法可能适用于其他领域,如图像分类、文本分类、生物信息学等,只要数据具有可挖掘的风格信息和结构特性。 基于社交网络的双知识表达分类方法是一种结合了社交网络分析和数据风格挖掘的新型分类技术,它通过双知识约束提升了分类的准确性和鲁棒性,特别适用于那些数据风格信息丰富的场景。