隐私保护支持向量机算法在大数据中的研究

版权申诉
5星 · 超过95%的资源 1 下载量 51 浏览量 更新于2024-07-04 收藏 1.79MB PDF 举报
"这篇硕士学位论文主要探讨了大数据环境下的隐私保护问题,特别是在支持向量机(SVM)算法的应用中如何确保数据隐私。论文作者提出了针对垂直分布和水平分布数据的隐私保护支持向量机算法,旨在解决数据挖掘过程中可能出现的个人信息泄露问题。" 支持向量机(SVM)是一种基于统计学习理论的机器学习模型,尤其在文本识别、手写体识别、图像分类和生物信息学等领域表现出优越性能。相比于其他方法如神经网络,SVM具有强泛化能力,对高维数据处理效果良好,并能全局优化避免局部极值,因此在数据挖掘领域备受关注。 然而,随着大数据的广泛应用,数据隐私保护成为一个关键问题。论文指出,传统的SVM算法可能在处理过程中泄露个人敏感信息。为解决这一问题,作者分别针对垂直分布和水平分布的数据提出了两种隐私保护策略。 对于垂直分布数据,论文扩展了SSP协议,设计了一个新的隐私保护支持向量机算法。这个算法通过使用可逆矩阵对数据进行变换,提高了效率并增强了安全性。同时,该方法还能应用于水平分布数据,同样确保数据隐私。 针对水平分布数据,论文采用加法同态加密技术对数据进行加密,使得各方可以在不暴露局部核矩阵的情况下协同计算,这确保了在垂直分布数据上的支持向量机训练过程中的数据隐私。 这篇论文对支持向量机算法进行了深入研究,不仅阐述了SVM的基本概念、模型和进展,还分析了其在实际应用中的隐私风险,并提出了解决方案。关键词包括支持向量机、数据隐私、垂直分布数据、水平分布数据以及隐私保护算法,这些关键词涵盖了论文的核心内容和研究焦点。这些研究成果对于在大数据环境中实施安全的数据挖掘和分析具有重要意义。