分布式基因序列安全计算:基于SMC的编辑距离算法

需积分: 10 0 下载量 54 浏览量 更新于2024-08-08 收藏 1.19MB PDF 举报
"基于安全多方计算的分布式基因序列相似性计算 (2016年) - 王立昌,方勇" 这篇论文探讨了在基因序列分析中的一个重要问题,即如何在保护隐私的前提下进行基因序列的相似性计算。编辑距离是衡量两个序列相似度的一种常用方法,特别适用于基因序列分析,但传统的编辑距离计算方法可能涉及到敏感数据的泄露。针对这一问题,论文提出了一个基于安全多方计算(Secure Multiparty Computation, SMC)的分布式基因序列近似编辑距离计算方案。 安全多方计算是一种密码学技术,由Goldreich-Micali-Wigderson(GMW)协议作为理论基础,允许多个参与者在不透露各自输入数据的情况下共同执行计算。在这个背景下,论文提出了一种利用秘密共享理论实现的SMC协议,旨在提高基因序列编辑距离计算的效率和实用性。 该方案的关键在于,它能够让多个参与单位(如不同的科研机构或医院)在分布式环境中并行计算不同基因序列间的编辑距离,而无需暴露各自的原始基因数据。这种设计确保了数据的隐私性和安全性,同时提升了计算效率,使其具备实际应用的可能性。 论文通过实验验证了所提方案的性能,结果显示,该方案不仅能够安全地执行基因序列的相似性计算,而且在分布式环境下的效率也得到了显著提升。这为基因序列分析提供了新的隐私保护策略,尤其对于涉及个人隐私的基因数据处理,具有重要的理论和实践意义。 关键词包括:编辑距离、安全多方计算、信息安全、基因序列对比、隐私保护分析和分布式计算。论文的研究工作属于工程技术领域,受到国家自然科学基金的支持,主要研究方向涵盖通信与编码、信息安全以及图像处理等多个交叉学科。 这篇论文为基因序列分析提供了一种创新的隐私保护计算模型,为未来在生物信息学、医学研究等领域中实现高效且隐私安全的基因数据分析奠定了基础。