GPU加速的G-FQZip:无损FASTQ文件参考压缩优化
144 浏览量
更新于2024-08-27
收藏 331KB PDF 举报
G-FQZip是一项由Cong Peng、Qingjin Deng、Zhi-An Huang、Yiwen Sun(*)和Zexuan Zhu共同完成的研究论文,针对快速增长的高通量测序数据存储和传输的需求,提出了一种利用GPU进行的无损参考依赖式FASTQ文件压缩方法。在当前的大数据时代,海量的基因测序数据对高效压缩技术提出了严峻挑战。G-FQZip的独特之处在于其将传统的损失less压缩策略与GPU加速相结合。
论文的核心贡献包括一个GPU支持的算术编码算法,这是一种高效的熵编码方式,通过并行处理能力显著提高了压缩和解压缩的速度。此外,文中引入了模板匹配方法,这是一种并行轻量级映射模型,用于快速识别和匹配参考序列中的重复模式,从而进一步提升了压缩效率。这些技术的结合使得G-FQZip能够在保持与传统方法相当的压缩比的同时,显著提升性能。
对比实验结果显示,G-FQZip在实际应用中表现出色,无论是压缩还是解压缩速度都得到了显著提升,对于大规模FASTQ文件的处理尤为有利。后续的评估证实了GPU加速算术编码和模板匹配方法在实际操作中的高效性和实用性。
关键词包括GPU加速、参考依赖的DNA序列压缩、高通量测序以及无损压缩。G-FQZip代表了一种创新的解决方案,它不仅解决了存储和传输高通量测序数据的问题,还展示了GPU在生物信息学领域中的潜力,为未来的基因组学研究和数据分析提供了强大的工具。这项工作对于优化生物信息学数据处理流程和降低计算成本具有重要意义。
2019-10-10 上传
2021-04-29 上传
2021-05-25 上传
2021-04-30 上传
2021-04-24 上传
2021-05-29 上传
2021-04-13 上传
2021-05-15 上传
weixin_38620741
- 粉丝: 1
- 资源: 909
最新资源
- torch_spline_conv-1.2.1-cp37-cp37m-win_amd64whl.zip
- ember-socrata:与Socrata开放数据服务进行交互的适配器和序列化器
- ejb-rmi-test
- poke-rent
- wildberries
- ANNOgesic-1.0.13-py3-none-any.whl.zip
- time-profile:测量功能的执行时间
- ExcelVBA-AutoCompleteList:创建一个像自动完成这样的Google,以从列表中提取数据
- 端午节活动吃豆人游戏源代码
- JAVA获取音频时长jar包依赖.zip
- 印刷行业网站模版
- cnn-asl-recognizer:一种深度学习应用程序,它通过训练3层卷积神经网络以78%的精度识别手语中的数字0到5。 1080个训练样本。 120个测试样品。 64 x 64像素的图像。 基于吴安德(Andrew Ng)在Coursera上的深度学习专业
- SDJ2Z-A2
- mdnote.github.io:Free Online Markdown Note | 开源免费的在线 Markdown 记事本
- moteur-d-inference:这是在我的高等教育框架内开发的一个项目,其中包括使用开发语言 PYTHON 创建推理引擎
- oss-browser-win32-x64.zip