"GPU数据库核心技术综述及其在数据分析领域的应用"

GPU

核心技术

需积分: 5 198 浏览量更新于2024-01-18 收藏 1.27MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

GPU数据库是一种利用图形处理器单元（GPU）进行计算的数据库系统。由于GPU具有超高速的计算能力和超大数据处理带宽，因此得到了数据库厂商和研究人员的青睐。以GPU计算为核心的数据库分支（GDBMS）因其具有吞吐量大、响应时间短、成本低廉、易于扩展等特点，与人工智能、时空数据分析、数据可视化、商务智能交互融合能力的结合，彻底改变了数据分析领域的格局。 GDBMS主要包含了四个核心组件，即查询编译器、查询处理器、查询优化和存储管理。查询编译器负责将用户提交的查询语句转换为可以在GPU上执行的计算任务。它会对查询语句进行语法分析和语义分析，生成相应的GPU计算代码。查询编译器的设计往往需要考虑到GPU计算的特点，如并行计算、数据传输优化等。查询处理器是GDBMS的核心模块，负责执行查询任务。它将经过编译的查询代码发送到GPU上进行并行计算。查询处理器需要管理GPU上的计算资源，如线程调度、内存管理等。同时，它还需要处理查询结果的传输和整合，确保计算结果的正确性。查询优化是GDBMS中的重要环节，它通过对查询语句进行优化，提高查询执行效率。查询优化的目标是选择最优的查询执行计划，即选择最合适的算法和数据存储方式来执行查询。在GPU数据库中，查询优化的挑战在于需要考虑到GPU计算的特性，例如并行计算的开销、数据传输的开销等。存储管理是GDBMS中的另一个重要组件，它负责数据在GPU内存和CPU内存之间的传输和管理。在GPU数据库中，由于GPU内存和CPU内存是两个独立的物理内存，因此数据的传输涉及到数据划分和数据迁移的问题。存储管理需要设计合理的数据结构和算法，以减少数据传输的开销。总而言之，GPU数据库以其超高速计算能力和超大数据处理带宽，以及与人工智能、时空数据分析、数据可视化、商务智能交互融合能力的结合，彻底改变了数据分析领域的格局。目前，GPU数据库的核心技术主要包括查询编译器、查询处理器、查询优化和存储管理等方面。随着GPU技术的不断演进和数据库领域的深入研究，相信GPU数据库将在未来得到更广泛的应用和发展。

资源详情

资源推荐

864

Journal of Software 软件学报 Vol.32, No.3, March 2021

模块,将 SQL 直接编译为 CUDA 或 OpenCL 驱动能执行的代码,以算子为单位进行即时编译

[19].

适配器

模式在运行时的编译负载会比较高,在提高了系统对显卡种类多样性的同时,牺牲了针对特定显卡的

性能优化,需要结合查询并行、分布式计算等技术来提升性能.此外,为应对 GPU 硬件的多样性,尤其是

为弥合 NVIDIA 显卡和 AMD 显卡两家处于竞争中的两种架构之间的不同,Ocelot

[35]

等系统使用

OpenCL 框架,避免为 GPU 不同架构分别编写代码造成的代码膨胀问题.

基于 LLVM 中间表示的 GPU 通用编译工具能够很好地隔离硬件多样性,做到编译各阶段彼此孤立,给

GDBMS在编译的各个阶段进行优化提供了可能.未来,基于编译自动化工具的研究将极大提升 GDBMS系统的

性能.

2.2 GPU数据处理模型

数据库中,从数据处理模型来看,可分为 3 种:迭代模式(iteration)、批量模式(batching)或二者的混合.传统的

DBMS 往往采用一次一行的流式迭代模型,也就是著名的火山模型(volcano model)处理查询请求.时至今日,研

究界和工业界提出了各种改进版的火山模型来规避其缺点,比如增加每次迭代的数据量、使用 SIMD 指令一次

处理多个数据、推拉结合的数据获取方式等,目前仍然是数据库中的主流编译技术.批量模式是将每个查询编

译为可执行代码,采用完全物化的方式处理所有数据.批量模式相较火山模型的迭代模式,在提高局部性、减少

运行时解释开销、使用 SIMD 指令方面有很大优势,但在实现 ad-hoc 查询上,面临灵活度不够、物化存储空间

要求过高的问题.因此,实践中将两者结合的方式更有优势,比如微批量化查询处理.该类方案使用不同的粒度

作为数据处理的单元,仍然在逻辑上组织成树型结构,让数据自底向上流动完成查询操作,兼具迭代模型的灵活

性和批处理的高吞吐量的优点.

GDBMS 普遍采用向量化一次一算子数据处理模式,并以此改造查询编译器.

• 首先,迭代模式并不适合 GDBMS,因为火山模型赖以存在的虚函数机制因为 GPU 缺乏对应的复杂逻

辑控制模块,在 GPU 上不可实现或者引起严重的线程分支恶化问题.迭代模型的灵活性是“彼之蜜糖,

我之毒药”,实际上会损害 GPU 的性能.GPU 的 SIMT 采用大规模线程并发的方式来提高数据处理的速

度,批量执行可以有效降低生成计划的函数调用次数,将列数据细粒度分配给 GPU 线程,并用循环展开

的方式,可有效减少控制指令总量,有效降低分支恶化的风险;

• 其次,列式处理更适合 GDBMS.一次一行的处理数据方式在代码上需要做大量的逻辑判断,而这正是

GPU 的劣势;一次一列来处理数据时,由于每列数据类型一致,可以用向量化方式处理,避免了分支判

断劣化性能问题,更适合 GPU 计算.此外,有研究

[36]

证实:对于 OLAP 业务,按行为单位的处理模型即使

行被合理分区并增加列索引等优化策略后,仍然不如列式处理高效.事实上,列式处理模型自

MonetDB

[37]

首次引入后,其后续系统 X100

[38]

将流水化(pipelining)引入列式处理模型中.GDBMS 系统

普遍采用列式处理模型

[30]

,比如 Ocelot

[13]

,CoGaDB

[10]

等;

• 再次,由于 GPU 的大规模并行编程模型依赖于对数据的并行处理,很多算法想在 GPU 上运行必须适应

单指令多线程(SIMT)的编程范式,所以需要对关系算子进行并行化改造,使得同一指令同时处理多个

关系数据处理需求,充分利用 GPU 的并发编程优势.“一次一算子”的数据处理模式就是:让数据在 GPU

向量化算子间流动,每次采用完全物化的策略保存算子输出的中间结果,作为下一个算子的输入数据;

• 最后,为了降低物化代价,通过适当分区切分数据,可以使 GDBMS 兼具迭代模式的最大的优点——流

水化处理数据的能力

[39]

.为了加速数据处理以及利用合理分区数据,采用数据流水化处理(pipelining

data processing),有效提高数据处理并行度.文献[40]通过细粒度划分数据,将处理整个列的算子切成更

小的算子单元,在 GPU 上实现了相关算子间流水化处理数据.

3 查询处理器

GDBMS 查询处理引擎接受处理查询编译器输出的查询计划树 QEP(query execution plan)并执行查询返回

结果,是利用 GPU-CPU 异构计算处理用户查询请求的核心模块.从功能角度来看,GDBMS 查询处理引擎面对的

剩余26页未读，继续阅读

小小鸟1221

粉丝: 6
资源: 119

"GPU数据库核心技术综述及其在数据分析领域的应用"

GPU数据库核心技术综述.pdf

GPU 数据库核心技术综述1

windows命令行查看英伟达GPU核心数量

（8） 基于GPU的渲染技术

如何使用多线程或GPU加速等技术来提高算法效率

浅析gpu通信技术(下)-gpudirect rdma

GPU测试方法、计算公式

c sharp 调用gpu

GPU模组和GPU卡的区别

vsphere gpu 虚拟化

GPU直通和GPU硬件虚拟化

GPU0和GPU1是什么意思

Starvcenter可以做到GPU虚拟机吗？

Lauterbach如何调试VSI GPU

GPU Warp是什么意思

英伟达a10 gpu是那一年的，与a40 gpu比，性能差别如何

文献综述，讲GPU并行计算在深度学习的应用

gpudirect rdma

cuda gpu运算性能决定

tensorflow_gpu1.14

最新资源

（8）基于GPU的渲染技术