内存云中大块数据对象的并行存取策略

0 下载量 73 浏览量 更新于2024-08-27 收藏 505KB PDF 举报
"基于内存云的大块数据对象并行存取策略" 随着大数据时代的到来,内存云(RAMCloud)作为一种高性能的存储系统,由于其高速访问和低延迟的特性,受到了广泛的关注。然而,传统的内存云通常限制单个数据对象的最大大小为1MB,这在处理大块数据对象时构成了挑战。为了克服这一限制,研究人员提出了一种基于内存云的大块数据对象并行存取策略。 该策略的核心思想是将大块数据对象分割成多个1MB的小数据对象,以便它们可以适应内存云的存储限制。在客户端,对每个分割后的数据对象生成数据摘要,这是为了确保数据完整性和验证读取过程的正确性。然后,利用并行存储算法,这些小数据对象被分布存储到内存云集群的不同节点上,充分利用了集群的并行处理能力。 在读取过程中,首先检索数据摘要,随后并行地从内存云集群中读取对应的数据块。通过高效的合并算法,这些小数据对象被重新组合成原始的大块数据对象。实验结果显示,这种并行存取策略能够在保持内存云原有体系结构不变的情况下,实现大约16至18微秒的存储时间和6至7微秒的读取时间,显著提升了大块数据的存取效率。 在InfiniBand网络环境下,提出的并行算法加速比呈现出接近线性的增长趋势。这意味着随着并行度的增加,存取速度会进一步提升,使得大块数据对象也能如同小块数据一样,在微秒级别实现快速且高效的存取操作,这对于高性能计算和大数据应用具有重大意义。 此外,该研究由多个国家自然科学基金资助项目支持,涉及的研究方向包括云存储、内存计算、绿色计算、网络安全、网格计算、分布式计算以及高性能计算等。研究团队成员包括硕士研究生和博士研究生,他们在各自的领域有着深入的研究,如云计算、分布式计算和内存计算等。 基于内存云的大块数据对象并行存取策略通过创新的数据分割、摘要生成、并行存储和读取方法,成功解决了内存云在处理大块数据时的局限性,提高了内存云在大规模数据处理中的效能,为未来云存储系统的设计和优化提供了新的思路。