医疗辅助诊断系统的双向隐私保护方法:结合决策树与不经意传输

需积分: 0 0 下载量 197 浏览量 更新于2024-06-28 收藏 4.63MB PDF 举报
"这篇论文探讨了在医疗辅助诊断系统中应用新型双向隐私保护方法,结合了决策树和不经意传输(Oblivious Transfer, OT)技术,旨在保护患者隐私及查询过程中的信息安全。" 在医疗辅助诊断系统中,患者的个人隐私保护是一个至关重要的问题。论文提出了一种创新的方法,它首先运用决策树算法对已有的诊断信息进行分类,形成辅助诊断模型。决策树的构建过程通过差分隐私技术增强,以防止在构建过程中泄露数据库的敏感信息。差分隐私是一种统计学方法,可以在提供有用数据分析的同时,保证单个个体的信息无法被识别。 接下来,论文引入了不经意传输(OT)技术,这是一种密码学概念,用于在双方之间安全地交换信息,其中一方可以获取所需信息而不让另一方知道其选择的信息内容。在查询过程中,OT技术保护了客户端的查询隐私,避免了服务器或数据库了解客户端的具体查询内容。 为了解决决策树算法与OT协议的结合问题,作者提出了一种决策树索引协议。这个协议使得决策树的查询操作能有效地与OT协议相互配合,实现了在保护隐私的同时,客户端仍能获得准确的查询结果。 论文强调,提出的双向隐私保护方法首次将决策树与OT技术整合应用于医疗辅助诊断系统,全面保护了客户端、服务器和数据库的隐私。理论分析显示,这种方法在保护隐私的同时保持了较高的通信效率。实验结果进一步证实,该方法不仅查询效率高,而且查询准确率也高。 关键词包括:医疗辅助诊断、双向隐私保护、决策树和不经意传输。该研究对于促进医疗信息系统的安全性和隐私保护具有重要意义,为今后相关领域的研究提供了新的思路和方法。
2022-12-24 上传
/ 51 CHINA MANAGEMENT INFORMATIONIZATION 2015 年 2 月 第 18 卷第 4 期 中 国 管 理 信 息 化 China Management Informationization Feb.,2015 Vol.18,No.4 随着大数据时代的来临, 各行业和领域都开始涉及大数据。笔 者所在的中南大学湘雅医院, 每年所产生的医疗数据非常庞大, 所以 大学相关研究部门开始收集和研究学校附属医院的临床资源和数据, 通过临床研究来推动医学的发展。在此基础上, 中南大学还专门设立 了湘雅临床大数据系统建设项目。同时, 由于个人的数据具有一定的 隐私性, 应该受到法律和法规的保护。本文通过对当前医疗大数据的 研究和应用现状的分析, 深入讨论了大数据应用中可能存在的隐私保 护问题, 在此基础上对现有的防护技术和手段进行梳理, 希望能够找 到大数据环境下对医疗隐私数据的保护方法。 1 医疗大数据的现状 现代化的医院中, 普遍采用电子病历, 彻底改变了传统的就医 模式, 实现了由纸质病历向电子化病历的转变, 并由医院对这些病 历进行统一保存。这些电子病历中所存储的各种各样的医嘱数据、 诊断数据为科研教学提供了直接的数据支持。此外, 在一份比较完 整的电子病历中, 还包含了医技科室中所产生的各种检验和检查信 息, 这些数据都可以在科研中加以应用。 现在, 在专业化的医技科室中, 采用了很多专业的信息化系 统, 比如在检验科室中所采用的 LIS 系统等, 可以通过检验仪器与 信息系统的连接, 实现在系统中对各种实验样品、 数据的管理与存 储, 此外, 还能开展其他相关的服务, 从而实现检验科室的规范化、 智能化与自动化。此外, 还有一些其他系统, 如 PACS 系统、 手术麻 醉系统等, 都能够为相关的专业科室提供更加便捷的服务, 有助于 提高医院的管理水平和医疗质量, 大幅减少各种医疗事故的发生。 这些专业的医疗信息化系统的广泛使用, 使得收集医疗数据更加便 利, 也让电子病历更加完整。但是, 随之而来的个人隐私的泄露问 题也同样不容忽视。 2 医疗大数据的隐私保护 2.1 非交互式泄露 所谓的非交互式泄露, 就是在医院的内部信息化系统出现隐私 泄露问题。需要强调的是, 现在医院中的多个业务流程存在很多节 点, 都能够对数据进行访问, 存在非交互式隐私泄露的可能。 2.2 交互式泄露 交互式的医疗数据泄露, 主要是由于医疗数据内容的特殊性, 这些数据在没有经过妥善处理的情况下, 会给相关人员造成极大 伤害。比如, 如果将某个孕妇的个人信息泄露出去, 则可能引发一 系列的推销、 诈骗等问题。而这种隐私泄露的危险性在大数据环境 中, 不再仅仅局限于泄露问题本身, 而在于以这些数据为依托所进 行的下一步行为的预测。比如通过对某个患者检验指标的获取, 就 可以得到对健康状况的准确判断, 进而为下一步行为做出预判和分 析。在很多情况下, 人们普遍认为只要能够对数据进行匿名处理, 或者隐藏重要的信息字段, 个人隐私就可以免于泄露, 但是, 大量的 事实证明, 通过收集其他信息, 就可以很容易对个人进行定位。 3 隐私保护研究现状 3.1 标识隐私匿名保护 在具体的患者诊疗档案中, 通常都会以该患者的姓名、 证件 号码等作为唯一标识, 但是, 这些信息本身就是应该予以保护的内 容, 所以, 正确的做法应该是在不影响信息准确性的前提下, 对信 息进行匿名保护。针对这种思路, 有的研究人员进一步提出在隐私 保护数据发布过程中, 对身份进行保护的匿名方法, 即在需要发布 的数据中首先进行身份标识删除, 然后再对准标识数据进行匿名处 理, 这样, 就可以在保护隐私的基础上, 进一步提高信息的准确性, 而在此方法的实施过程中, 可以采用概化和有损连接等两种方式。 3.2 医疗数据的分级保护制度 不同的信息, 在隐私保护中的权重并不一样, 所以, 如果对这些 信息一概而论, 都采用高级别的保护手段, 则会实际的应用效率产 生影响, 还会造成资源的浪费。但是, 如果只针对核心信息进行防 护, 也可能造成隐的信息泄露。所以, 需要构建比较完善的数据分 级制度, 对于不同级别的个人信息和数据采用不同的保护措施。 3.3 基于访问控制的隐私保护 在医疗领域信息化系统中, 其隐私防护的难点主要在于参与的 人员比较多, 使得潜在的泄露点也相应增加。利用访问控制技术, 可以对不同的人员设置不同的访问权限, 进而访问不同的数据和内 容, 这样做也可以有效解决数据的分级问题。比如, 对于财务部门 的人员, 就应该只能访问患者的费用相关信息, 而不能对医生的诊 断信息进行查看。现在广泛采用的访问控制技术, 主要为基于角色 的访问控制, 能够很好地