私人近似处理中的聚类与顶点覆盖不可行性突破

0 下载量 24 浏览量 更新于2024-06-17 收藏 535KB PDF 举报
聚类与顶点覆盖的私有近似处理是一项关于隐私保护计算的重要研究领域,它关注在执行搜索问题时如何找到近似解,同时限制信息泄露。本文的焦点在于两个经典图论问题:顶点覆盖和k-聚类。顶点覆盖问题在之前的研究中已被探讨,如在Beimel、Carmi、Nissim和Weinreb的STOC 2006论文中,但本文在此基础上进行了深入分析。 首先,顶点覆盖问题是一个重要的NP-hard问题,涉及找到覆盖图中所有边所需的最小顶点集合。在私有近似处理的背景下,作者揭示了一个严格的不可行性结果:任何能够达到ρ(n)逼近度(即返回解的大小接近最优解的ρ倍)的顶点覆盖算法,必然泄漏至少Ω(n/ρ(n))位的信息。这表明,为了保护隐私,顶点覆盖问题的算法设计必须极其谨慎,因为它涉及到大量信息的泄露。 对于k-聚类问题,研究者同样发现了类似的结果。他们证明了即使是近似比非常低的算法,也必须泄漏至少Ω(n)位的信息,这里的n指的是问题实例中的点数。这一发现强调了在设计这类聚类算法时,隐私保护是一个至关重要的考虑因素。 为了得出这些结论,作者发展了一种新的证明技术,相较于之前的Beimel等人,这种方法更为直观且能支持更强的不可行性结果。他们的论证策略结合了Promise问题的复杂性(问题存在唯一最优解)、NP-hard问题的近似见证难度以及随机嵌入技术,这些工具共同揭示了私有近似处理中这些问题的固有限制。 这项工作的背景是安全多方计算,其中多方希望在不暴露各自数据的前提下合作计算。尽管一般情况下多项式时间可计算函数的问题可以得到解决,但对于非函数性和计算不可行的问题,如顶点覆盖和聚类,需要特别关注隐私保护。作者得到了以色列科学基金会的资助,以及弗兰克尔计算机科学中心的支持,部分研究工作是在加州大学洛杉矶分校进行的。 总结来说,本文对聚类与顶点覆盖问题的私有近似处理提供了严格的界限,对于设计在隐私保护下有效运行的算法具有重要意义,同时也促进了我们理解复杂计算问题在安全环境下的限制。