云环境数据安全去重技术现状与趋势分析

189 浏览量更新于2024-08-29 收藏 710KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"云环境中数据安全去重是提高云存储效率和网络通信带宽的关键技术。随着越来越多的数据被上传到云端，重复数据的检测与删除成为必要，但加密的云数据给这一过程带来挑战。文章深入探讨了数据安全去重在云环境中的原因、主要难题，构建了系统模型和威胁模型，并重点研究了三种主要的技术实现机制：基于内容加密的安全去重、基于所有权证明的安全去重以及隐私保护的安全去重。文章对这些技术的优势和存在的问题进行了详尽的分析，同时展望了该领域的未来研究趋势和可能的发展方向。" 云环境中的数据安全去重是一项旨在优化存储资源和节省网络带宽的重要技术。随着云计算的普及，用户在云端存储的数据量急剧增长，大量冗余数据的存在不仅浪费了存储空间，也加重了网络传输的负担。然而，由于云环境中的数据通常是加密的，这使得传统的去重技术无法直接应用，因为无法在不解密的情况下比较数据内容，从而引发了数据安全去重的迫切需求。在安全性角度，云数据安全去重需要解决的主要问题包括数据隐私保护、数据完整性验证以及防止恶意的数据篡改。为了克服这些挑战，研究者提出了多种策略： 1. 基于内容加密的安全去重：这种技术允许在加密数据上进行去重操作，无需先解密数据。它通常结合了同态加密和哈希函数，使得加密后的数据片段可以被比较，从而识别重复数据。这种方法的优点是能保护数据隐私，但计算复杂度较高，可能导致效率下降。 2. 基于所有权证明的安全去重：这种方法依赖于用户拥有数据副本的证明，而不是直接比较数据内容。用户通过某种方式（如零知识证明）证明自己拥有特定数据，而无需揭示数据具体内容。这种方式可以避免数据泄露，但实现起来复杂，且需要信任第三方。 3. 隐私保护的安全去重：此方法侧重于在保护用户隐私的同时进行去重，如使用差分隐私技术，通过添加噪声来模糊个人数据，使得去重过程不侵犯用户隐私。然而，噪声的添加可能会影响去重的准确性。每种技术都有其优势和局限性，比如基于内容加密的方法可能牺牲了效率，而基于所有权证明的方法可能需要复杂的证明过程。因此，未来的云数据安全去重研究将致力于寻找更高效、更安全的解决方案，可能的方向包括改进现有的加密算法以降低计算复杂度，设计更高效的身份验证机制，以及探索新的隐私保护技术，以适应不断变化的云存储环境和用户需求。在未来，随着区块链、多方计算等新兴技术的发展，数据安全去重领域可能会出现更多的创新解决方案。例如，利用区块链技术的不可篡改特性进行数据去重和所有权验证，或者利用多方计算实现数据去重的同时保护用户隐私。此外，跨云和边缘计算环境的数据安全去重也将成为重要的研究课题，以应对更复杂、更分散的存储场景。云数据安全去重将持续作为一个活跃的研究领域，不断推动云计算服务的安全性和效率。

资源详情

资源推荐

第 11 期熊金波等：云环境中数据安全去重研究进展 ·171·

户计算资源、存储资源等的按需分配。当云服务器

检测到多用户之间具有重复数据后，执行去重操

作，则其很容易识别多用户之间的重复数据量，这

本身就泄露了用户和数据的部分隐私，如何既实现

数据去重又保护用户隐私是亟需解决的一个难题。

3) 侧信道攻击。在跨用户安全去重的任务执行

过程中，可能因文件的大小、类型、散列值等信息

而产生侧信道攻击，通过识别文件、试图学习文件

内容和建立隐蔽通道

[8]

而揭露用户的身份、职业、

敏感文件等隐私信息。如何在云数据安全去重过程

中，避免侧信道攻击以保护参与用户的隐私成为亟

需解决的另一个关键问题。

2.2 系统模型

本节将介绍云数据安全去重机制的通用系统

模型，如图 1 所示，主要实体包含用户、云服务器、

第三方服务器。

图 1 云数据安全去重的系统模型

用户将文件进行预处理后上传到云服务器，该服

务器负责存储文件与相关文件标识，当其他用户再次

上传相同文件时，云服务器执行数据安全去重工作。

通常情况下，数据安全去重方案只包含用户与

云服务器 2 个实体，如文献[9~13]等。但为了安全

需要或实现对密钥的有效管理，许多方案引入第三

方服务器，如文献[14~17]等引入密钥服务器来专门

存储和管理密钥；文献[18, 19]等引入文件索引服务

器提供安全的文件索引，此外，文献[18]还引入身

份验证服务器来验证用户身份和抵抗 Sybil 攻击。

2.3 威胁模型

本节主要描述云数据安全去重机制中常见

的

攻击类型和攻击行为

[20]

，以及抵抗这些攻击的相关

方案，如表 1 所示。

蛮力攻击。收敛加密(CE, convergent encryption)

的密钥由原始文件计算而来，因此，知道密文的敌

手可对猜测的明文进行加密并与之进行对比，则可

能猜测出原始数据。针对该攻击，DupLESS

[14]

提出

使用不经意伪随机函数(OPRF, oblivious pseudo-

random function)的密钥服务器(KS, key server)来产

生密钥，即密钥是由数据本身和一个系统层面的密

钥共同决定，实现了数据的保密性并能抵抗蛮力攻

击。针对 KS 和云服务器合谋导致敌手可以获取密

文和密钥的问题，Miao 等

[17]

提出一种基于门限盲

签名与可校验秘密共享机制的多密钥服务器数据

去重方案，即密钥由多个 KS 合作产生，每个 KS

只有密钥分量，无法得到完整密钥，有效防止单个

KS 与云服务器的合谋。

侧信道攻击。主要分为 3 种：1) 识别文件，攻

击者上传特定的文件到云服务器，根据数据去重是

否发生来判断其是否拥有该文件；2) 学习文件内

容，识别特定文件是否存储在服务器之后，攻击者

可能为了确定文件的内容而进行穷举攻击；3) 建立

隐蔽信道，攻击者设法在用户的电脑上安装恶意软

件，利用数据去重建立隐蔽信道与外部通信。

针对上述攻击，Chen 等

[10]

提出一种将秘密共

享机制 AONT-RS 与 CE 结合的 CDStore 方案，进

行用户本地和全局 2 个阶段的去重，有效解决了侧

信道攻击。Puzio 等

[16]

在 CE 加密的基础上增加额外

的语义安全加密方案和访问控制机制，提出

ClouDedup 抵抗侧信道攻击。此外，文献[21]提出

利用差分隐私(DP, differential privacy)技术

[22]

来抵

抗上述攻击。

字典攻击。在基于 CE 的数据去重方案中，敌

手跟云服务器合谋，将明文进行加密，与已知的密文

字典进行对比，则可以猜测到目标文件。即使数据

加密密钥由用户的私钥加密并且存储在安全的服

务器上，只要敌手可以得到加密密文，就可以实施

字典攻击。文献[16]方案可以抵抗字典攻击，而文

献[19]则提出对不同安全级别的文件进行不同级别

的加密来抵抗这类攻击。

伪造攻击。敌手利用云服务器无法区分明文和

密文的漏洞，上传一个加密文件以及与其不一致的

伪造指纹信息，使另一可信用户上传伪造指纹对应

的文件时，服务端回复已有该文件，导致无法上传，

而下载的却是敌手上传的伪造文件。为了抵抗这种

攻击，Bellare 等

[13]

在消息锁加密(MLE, message-

locked encryption)

[11]

的基础上提出交互 MLE (iMLE,

2016238-3

剩余11页未读，继续阅读

weixin_38656064

粉丝: 9
资源: 932

云环境数据安全去重技术现状与趋势分析

最新资源