高效凸包向量网络:乳腺癌分类的新方法

需积分: 8 0 下载量 11 浏览量 更新于2024-08-09 收藏 677KB PDF 举报
"这篇研究论文提出了一种名为高效凸包向量网络(ECHVN)的新算法,用于乳腺癌的分类。该算法基于对Graham Scan凸包算法的改进,利用SSGM排序,特别适用于处理可能存在重复值的大规模数据集。算法的时间复杂度在最佳情况下为O(n),最坏情况下为O(n log n),而空间复杂度为O(1),优于传统的Graham Scan算法。此外,还探讨了将ECH与支持向量机(SVM)相结合的应用,以提高分类性能。" 本文发表在2019年可持续计算科学、技术和管理国际会议(SUSCOM-2019)上,由Sunil Gupta, Vinita Gupta和Kratika Agarwal共同撰写。作者来自印度的不同学术和工业背景。 文章的核心在于解决凸包问题,特别是对于那些包含重复值的数据集。凸包是多边形边界的概念,在数据分析和机器学习中有着广泛的应用,如在乳腺癌分类中。传统的Graham Scan算法在处理这类问题时需要先进行排序,其时间复杂度为O(n log n),而新提出的ECH算法则降低了排序的需求,提高了效率。 ECH算法利用SSGM Sort进行优化,这是一种快速排序方法,可以有效地处理有重复值的情况。由于数据集可能包含重复元素,ECH算法能够在保持较低时间复杂度的同时,减少内存需求,达到常量级空间复杂度O(1)。这对于处理大规模数据集尤其有利,因为它避免了额外的存储开销。 此外,论文还引入了高效凸包向量网络(ECHVN),这是在结合了ECH算法和SVM的优势后构建的。SVM是一种强大的监督学习模型,常用于分类任务,尤其是二分类问题。通过将数据表示为凸包向量,并结合SVM的分类能力,ECHVN有望提高乳腺癌分类的准确性,同时保持计算效率。 总结来说,这篇论文贡献了一种新的数据处理方法,特别是对于医疗领域的癌症分类,它降低了计算复杂性,提高了空间效率,并探索了与SVM的集成,从而提升了预测模型的性能。这一进展对于未来的大数据驱动的医学诊断和研究具有重要意义。