REGISTOR:SSD内建的高速非结构化数据处理平台
REGISTOR是一个专为SSD(固态硬盘)内部非结构化数据处理设计的高性能平台,由裴舒怡、杨静和杨青在罗德岛大学以及深圳市大普微电子有限公司共同研发。其主要目标是解决大数据时代中正则表达式搜索的I/O瓶颈问题,通过在硬件层面进行优化,提升数据处理效率。 REGISTOR的核心技术包括一个特殊的硬件引擎,该引擎嵌入在SSD内部,能够动态地处理从NAND闪存传输的数据,实现与现代SSD内部总线速度的同步,从而加快regex搜索速度。其硬件结构采用了深度流水线设计,由四个关键组件构成:文件语义提取器负责解析文件内容,匹配候选查找器筛选可能的匹配项,regex匹配单元(REMU)执行正则表达式匹配,而结果组织器则整理和输出匹配结果。这种流水线设计充分利用了硬件资源,提高了并行处理能力。 为了便于高级应用程序使用,REGISTOR团队开发了一组API和库,这些接口使得用户可以高效地将SSD中的数据块整合为文件,简化了对大型数据集的处理流程。实验结果显示,REGISTOR在处理正则表达式搜索时,表现出显著的优势,如高吞吐量,降低了高达97%的I/O带宽需求和82%的CPU利用率,这对于大数据分析和挖掘任务来说,具有重大的性能提升潜力。 此研究还得到了NSF(美国国家科学基金会)的资助,以及URI(罗德岛大学)和深圳市大普微电子有限公司之间的研究合同的支持。REGISTOR的研究成果发表于《ACM Transactions on Storage》(2019年3月,卷15,第7期,24页),并提供了DOI链接[10.1145/3310149],反映了学术界和工业界对提高数据处理性能的持续关注。 总结来说,REGISTOR是一个创新的硬件加速器,它利用深度流水线技术和优化的硬件设计,解决了SSD存储中非结构化数据的处理问题,对于提升大数据处理的效率和降低计算成本具有重要的实际价值。
剩余23页未读,继续阅读
- 粉丝: 5
- 资源: 2万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++标准程序库:权威指南
- Java解惑:奇数判断误区与改进方法
- C++编程必读:20种设计模式详解与实战
- LM3S8962微控制器数据手册
- 51单片机C语言实战教程:从入门到精通
- Spring3.0权威指南:JavaEE6实战
- Win32多线程程序设计详解
- Lucene2.9.1开发全攻略:从环境配置到索引创建
- 内存虚拟硬盘技术:提升电脑速度的秘密武器
- Java操作数据库:保存与显示图片到数据库及页面
- ISO14001:2004环境管理体系要求详解
- ShopExV4.8二次开发详解
- 企业形象与产品推广一站式网站建设技术方案揭秘
- Shopex二次开发:触发器与控制器重定向技术详解
- FPGA开发实战指南:创新设计与进阶技巧
- ShopExV4.8二次开发入门:解决升级问题与功能扩展