没有合适的资源?快使用搜索试试~ 我知道了~
首页一文了解华为Gauss数据库:开发历程、OLTP&OLAP特点、行式&列式存储,及与Oracle和AWS对比…
一文了解华为Gauss数据库:开发历程、OLTP&OLAP特点、行式&列式存储,及与Oracle和AWS对比…
5星 · 超过95%的资源 27 下载量 84 浏览量
更新于2023-03-03
评论 3
收藏 1.47MB PDF 举报
数据库的重要性&华为推出新一代Gauss数据库 数据库是计算机行业的基础核心软件,所有应用软件的运行和数据处理都要与其进行数据交互。数据库的开发难度,不仅体现在与其他基础器件的适配,更在于如何实现对数据高效、稳定、持续的管理。Oracle、微软的数据库之所以能长久不衰,一方面在于其强大的技术开发和产品升级迭代能力,另一方面在于其对数据库的Knowhow理解足够深,这个是其他厂商短期难以超越的。华为在数据库领域逐步取得新的突破。2019年华为推出了新一代的数据库产品Gauss数据库,该产品已经在金融、能源、政企等国内客户得到上线应用。 华为Gauss数据库:AI原生&&支持异构计算 华为在数据库
资源详情
资源评论
资源推荐
一文了解华为一文了解华为Gauss数据库:开发历程、数据库:开发历程、OLTP&OLAP特点、行式特点、行式&列式存列式存
储,及与储,及与Oracle和和AWS对比对比…
数据库的重要性数据库的重要性&华为推出新一代华为推出新一代Gauss数据库数据库
数据库是计算机行业的基础核心软件,所有应用软件的运行和数据处理都要与其进行数据交互。数据库的开发难度,不仅体现在与其他基础器件的适配,
更在于如何实现对数据高效、稳定、持续的管理。Oracle、微软的数据库之所以能长久不衰,一方面在于其强大的技术开发和产品升级迭代能力,另一方
面在于其对数据库的Knowhow理解足够深,这个是其他厂商短期难以超越的。华为在数据库领域逐步取得新的突破。2019年华为推出了新一代的数据库
产品Gauss数据库,该产品已经在金融、能源、政企等国内客户得到上线应用。
华为华为Gauss数据库:数据库:AI原生原生&&支持异构计算支持异构计算
华为在数据库领域已经有12年的开发经验,从早期的摸索到现在的产品逐步成熟,中间也是经历了很多历程。华为的数据库产品系列命名为:
GaussDB,高斯数据库。华为GaussDB是一个企业级AI-Native分布式数据库。GaussDB采用MPP(Massive Parallel Processing)架构,支持行存储与列
存储,提供PB(Petabyte,2的50次方字节)级别数据量的处理能力。华为Gauss数据库是全球首款AI-Native数据库,能够同时支持X86、ARM、GPU、
NPU等异构计算。
华为华为Gauss数据库:三大产品线系列数据库:三大产品线系列
GaussDB:三大产品线系列。目前华为已经开发有三个产品系列:GaussDB 100、GaussDB 200、GaussDB300。1)GaussDB 100:主要以OLTP为
主。目前该产品已经应用在招商银行。2)GaussDB 200:以OLAP为主,兼顾OLTP。该产品目前已经在工商银行得到上线应用。3)GaussDB
300::HTAP,是企业级分布式HTAP数据库(Hybrid Transaction and Analytical Process,混合事务和分析处理)。
华为华为Gauss数据库:华为数据库:华为IT生态体系不可或缺生态体系不可或缺
从生态体系来看,Oracle数据库成为全球第一数据库的地位,也是经过了很多次版本的更新升级,更与上世纪80年代开始的全球IT生态体系的逐步确立有
关。Oracle数据库世界霸主地位,是随着Windows操作系统、Intel X86芯片一起建立的PC时代的IT底层生态而逐步确立的。而AWS数据库则是适应了互
联网时代(云计算时代)新的计算场景对数据库的新需求,再加上自身的云生态体系,逐步迎来了客户使用的推广。从华为Gauss数据库来看,华为IT架
构的底层生态已经逐步建立起来,包括芯片、操作系统、数据库等,这些在华为IT体系内部是高度耦合的。
华为数据库分析华为数据库分析
数据库是计算机行业的基础核心软件,所有应用软件的运行和数据处理都要与其进行数据交互。2008年阿里提出“去IOE”,而10年之后,我们现在来看,
发现Oracle的数据库是最难替换的。不仅是因为Oracle的数据库沉淀了大量的企业客户数据,更是因为数据库产品开发难度确实比较大。数据库的开发难
度不亚于操作系统,属于整个IT架构的基础软件(数据库软件在操作系统之上,我们可以将其称为类中间层的基础软件)。而且数据库的开发需要与底层
计算架构高度相关和耦合,是适配X86架构,还是适配ARM架构等等。
当然以上这些都是数据库的与其他基础器件的适配,数据库难度更大的地方在于如何实现对数据高效、稳定、持续的管理。Oracle、微软的数据库之所以
能长久不衰,一方面在于其强大的技术开发和产品升级迭代能力,另一方面在于其对数据库的Knowhow理解足够深,这个是其他厂商短期难以超越的。
回到这篇文章的主题:华为数据库。华为在IT的底层架构,逐步搭建起自己的基础架构,建立华为生态。我们这次把华为数据库进行讲解,并对目前主流
的数据库进行对比。只有对比,才能发现不同。 华为华为DB开发历程开发历程
华为对数据库的开发经历了长达华为对数据库的开发经历了长达12年左右的时间。年左右的时间。2007年,华为开始着手研发内存数据库,项目代号为年,华为开始着手研发内存数据库,项目代号为GMDB。这个项目的背景是,当时电信实施实时。这个项目的背景是,当时电信实施实时
计费,电信行业对数据库有特殊的要求,有些需要定制化开发。而当时国外的数据库产品主要是标准化产品。为了满足客户需求,华为当时开始研发内存计费,电信行业对数据库有特殊的要求,有些需要定制化开发。而当时国外的数据库产品主要是标准化产品。为了满足客户需求,华为当时开始研发内存
数据库。数据库。2010年,华为开始从内存数据库向通用关系型数据库进行拓展,逐步将非内存数据库的功能融入到数据库产品中。年,华为开始从内存数据库向通用关系型数据库进行拓展,逐步将非内存数据库的功能融入到数据库产品中。2012年,华为数据库性能得年,华为数据库性能得
到显著提升,到显著提升,GMDB开始逐步商用化,主要应用于电信计费。同时,该产品也在华为内部的部分部门开始使用。开始逐步商用化,主要应用于电信计费。同时,该产品也在华为内部的部分部门开始使用。2013年,华为年,华为OLTP数据库开始上线(后数据库开始上线(后
面我们会详细介绍面我们会详细介绍OLTP和和OLAP)。)。2014年,华为开发出第一个年,华为开发出第一个OLAP数据库版本(数据库版本(OLAP我们可以简单理解为:是针对大量数据的分析型数据库)。我们可以简单理解为:是针对大量数据的分析型数据库)。
2015年,华为与工商银行一起联合研发。年,华为与工商银行一起联合研发。GaussOLAP数据库在工商银行上线,逐步替代海外的数据仓库。数据库在工商银行上线,逐步替代海外的数据仓库。2017年,华为与招商银行一起联合开发年,华为与招商银行一起联合开发
GaussDB。同时,华为启动面向事务和分析混合处理的数据库开发,即。同时,华为启动面向事务和分析混合处理的数据库开发,即HTAP。。2018年,华为年,华为GaussOLTP数据库(事务型数据库)开始在招商银行综数据库(事务型数据库)开始在招商银行综
合支付交易系统成功上线。承接招商银行合支付交易系统成功上线。承接招商银行“手机银行手机银行”和和“掌上生活掌上生活”两大两大App交易流水流量。交易流水流量。2018年,年,GaussHTAP数据库推出,并在民生银行得到应数据库推出,并在民生银行得到应
用。用。从华为从华为Gauss数据库产品演化至今来看:数据库产品演化至今来看:1)华为数据库产品的研发是从内存数据库开始,逐步向通用关系型数据库延伸,这与)华为数据库产品的研发是从内存数据库开始,逐步向通用关系型数据库延伸,这与Oracle、、AWS数据数据
库开发的起点并不完全一样。库开发的起点并不完全一样。2)华为数据库产品类型,包括了)华为数据库产品类型,包括了OLTP、、OLAP,同时还研发出,同时还研发出HTAP产品。我们认为,从产品应用角度来看,华为产品。我们认为,从产品应用角度来看,华为
OLAP(分析型数据库)大规模应用的时点更早一些。(分析型数据库)大规模应用的时点更早一些。Oracle的的OLTP(事务型数据库)在全球领域的竞争优势非常明显,这一领域的数据库产品比较难(事务型数据库)在全球领域的竞争优势非常明显,这一领域的数据库产品比较难
替代。替代。3)华为的)华为的OLTP数据库是通过与大客户合作,特别是银行大客户合作(工商银行、招商银行),来不断进行产品迭代和完善的。我们认为,这也数据库是通过与大客户合作,特别是银行大客户合作(工商银行、招商银行),来不断进行产品迭代和完善的。我们认为,这也
是华为数据库能够快速成长的主要原因。是华为数据库能够快速成长的主要原因。 初识华为初识华为GaussDB
华为在数据库领域已经有华为在数据库领域已经有12年的开发经验,从早期的摸索到现在的产品逐步成熟,中间也是经历了很多历程。目前,华为数据库逐步建立起三大产品系年的开发经验,从早期的摸索到现在的产品逐步成熟,中间也是经历了很多历程。目前,华为数据库逐步建立起三大产品系
列。华为的数据库产品系列命名为:列。华为的数据库产品系列命名为:GaussDB,高斯数据库。高斯,是德国伟大的数学家,近代数学的奠基者之一,高斯、阿基米德、欧拉、牛顿被世,高斯数据库。高斯,是德国伟大的数学家,近代数学的奠基者之一,高斯、阿基米德、欧拉、牛顿被世
人称为世界上最伟大的四位数学家。华为将自己的数据库命名为人称为世界上最伟大的四位数学家。华为将自己的数据库命名为Gauss系列,也有向数学致敬的意味。系列,也有向数学致敬的意味。GaussDB::开源数据库。开源数据库。华为的华为的Gauss数据库是数据库是
一个开源数据库,基于一个开源数据库,基于PostgreSQL9.2开发。我们知道开发。我们知道PostgreSQL本身就是一个开源数据库品牌。现在除了本身就是一个开源数据库品牌。现在除了OracleDB、微软的、微软的SQLServer等传统老牌等传统老牌
数据产品之外,目前新开发的数据库产品,开源数据库占比较大的部分。包括我们看到的数据产品之外,目前新开发的数据库产品,开源数据库占比较大的部分。包括我们看到的AWS的的Aurora数据库、阿里的飞天数据库、华为的数据库、阿里的飞天数据库、华为的Gauss数据数据
库,以及数据库新进入者库,以及数据库新进入者MongoDB等。等。
GaussDB::分布式分布式&AI原生。原生。华为华为GaussDB是一个企业级是一个企业级AI-Native分布式数据库。分布式数据库。GaussDB采用采用MPP(Massive Parallel Processing)架构,支持行架构,支持行
存储与列存储,提供存储与列存储,提供PB(Petabyte,,2的的50次方字节次方字节)级别数据量的处理能力。可以为超大规模数据管理提供高性价比的通用计算平台,也可用于支撑各类级别数据量的处理能力。可以为超大规模数据管理提供高性价比的通用计算平台,也可用于支撑各类
数据仓库系统、数据仓库系统、BI(Business Intelligence)系统和决策支持系统,为上层应用的决策分析提供服务。华为系统和决策支持系统,为上层应用的决策分析提供服务。华为GaussDB将将AI能力植入到数据库内核的架构和能力植入到数据库内核的架构和
算法中,为用户提供更高性能、更高可用、更多算力支持的分布式数据库。算法中,为用户提供更高性能、更高可用、更多算力支持的分布式数据库。
GaussDB::三大产品线系列。三大产品线系列。高斯数据库研发始于高斯数据库研发始于2011年。目前年。目前
已经开发有三个产品系列:已经开发有三个产品系列:GaussDB 100、、GaussDB 200、、GaussDB 300。。GaussDB 100::主要以主要以OLTP为主。为主。GaussDB 100研发开始于研发开始于2011年,年,
与后面的与后面的GaussDB 200/300不同,不同,GaussDB 100并不是一个分布式数据库。并不是一个分布式数据库。GaussDB 100包括两条线,一条产品线是基于单机版开源数据库包括两条线,一条产品线是基于单机版开源数据库
PostgreSQL研发的产品,另一条线是自研内核的研发的产品,另一条线是自研内核的GaussDB 100产品。后面这一条线是近几年华为研发的产品。目前该产品已经应用在招商银行。产品。后面这一条线是近几年华为研发的产品。目前该产品已经应用在招商银行。
GaussDB 100主要是主要是OLTP,即事务型数据库。,即事务型数据库。GaussDB 200::以以OLAP为主,兼顾为主,兼顾OLTP。。华为华为GaussDB 200开始于开始于2012年,在基于传统关系型数据年,在基于传统关系型数据
库的库的SQL引擎和事务强一致性等基础上,进行了分布式、并行计算的改造。历时引擎和事务强一致性等基础上,进行了分布式、并行计算的改造。历时6年,打造了一款架构领先的分析型数据库,为各行业年,打造了一款架构领先的分析型数据库,为各行业PB级海量数据分析级海量数据分析
提供有竞争力的解决方案。提供有竞争力的解决方案。GaussDB 200既可以适用于既可以适用于OLTP,也可以应用于,也可以应用于OLAP。。GaussDB 300::HTAP,,OLTP和和OLAP。。GaussDB 300是一个分是一个分
布式并行关系型数据库系统,是企业级分布式布式并行关系型数据库系统,是企业级分布式HTAP数据库(数据库(Hybrid Transaction and Analytical Process,混合事务和分析处理)。,混合事务和分析处理)。GaussDB 300架架
构上着重构筑传统数据库的企业级能力和互联网分布式数据库的高扩展和高可用能力,完全兼容构上着重构筑传统数据库的企业级能力和互联网分布式数据库的高扩展和高可用能力,完全兼容SQL标准,提供百万级标准,提供百万级TPMC的交易处理能力和企业级可的交易处理能力和企业级可
靠性。靠性。GaussDB 200/300都是基于开源数据库都是基于开源数据库PostgreSQL研发,虽然是基于开源数据库,但已经对开源代码进行了大量修改,在很大程度上接近于自研发,虽然是基于开源数据库,但已经对开源代码进行了大量修改,在很大程度上接近于自
研。研。GaussDB 200/300既可以支持既可以支持OLTP也可以支持也可以支持OLAP,也是华为投入精力最大、研发时间最长的产品线。目前已经在工商银行和民生银行应用。,也是华为投入精力最大、研发时间最长的产品线。目前已经在工商银行和民生银行应用。
在以上我们对华为在以上我们对华为GaussDB的介绍当中,提到了数据库领域比较重的介绍当中,提到了数据库领域比较重
要的两个概念:要的两个概念:OLTP和和OLAP。下面我们就介绍下这两个概念,以及其所对应的数据库类型。华为。下面我们就介绍下这两个概念,以及其所对应的数据库类型。华为GaussDB数据库包括:事务性(数据库包括:事务性(OLTP)数据库、分)数据库、分
析型(析型(OLAP)数据库和混合负载()数据库和混合负载(HTAP)数据库。这里需要解释下)数据库。这里需要解释下OLTP、、OLAP、、HTAP之间的区别,这也是数据库最基本的内容。数据库系统一般之间的区别,这也是数据库最基本的内容。数据库系统一般
分为两种类型:一种是面向前台应用的,应用比较简单,但是重吞吐和高并发的分为两种类型:一种是面向前台应用的,应用比较简单,但是重吞吐和高并发的OLTP类型;一种是重计算的,对大数据集进行统计分析的类型;一种是重计算的,对大数据集进行统计分析的OLAP类类
型。型。1))OLTP::联机事务处理联机事务处理OLTP((on-line transaction processing))它是事件驱动、面向应用的,比如电子商务网站的交易系统就是典型的它是事件驱动、面向应用的,比如电子商务网站的交易系统就是典型的OLTP
系统。系统。OLTP的基本特点是:的基本特点是:- 数据在系统中产生;数据在系统中产生;- 基于交易的处理系统(基于交易的处理系统(Transcation-Based););- 每次交易牵涉的数据量很小;对响应时间要求非常每次交易牵涉的数据量很小;对响应时间要求非常
高;高;- 用户数量非常庞大,主要是操作人员;用户数量非常庞大,主要是操作人员;- 数据库的各种操作主要基于索引进行。数据库的各种操作主要基于索引进行。2))OLAP::联机分析处理联机分析处理OLAP((On-Line Analytical
Processing))是基于数据仓库的信息分析处理过程,是数据仓库的用户接口部分。是基于数据仓库的信息分析处理过程,是数据仓库的用户接口部分。OLAP系统是跨部门的、面向主题的,其基本特点是:系统是跨部门的、面向主题的,其基本特点是:- 本身不产生数本身不产生数
据,其基础数据来源于生产系统中的操作数据(据,其基础数据来源于生产系统中的操作数据(OperationalData););- 基于查询的分析系统;复杂查询经常使用多表联结、全表扫描等,牵涉的数量往基于查询的分析系统;复杂查询经常使用多表联结、全表扫描等,牵涉的数量往
往十分庞大;往十分庞大;- 响应时间与具体查询有很大关系;响应时间与具体查询有很大关系;- 用户数量相对较小,其用户主要是业务人员与管理人员;用户数量相对较小,其用户主要是业务人员与管理人员;- 由于业务问题不固定,数据库的各种操作不由于业务问题不固定,数据库的各种操作不
能完全基于索引进行。能完全基于索引进行。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,是数据仓库系统的主要应用,
支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。OLTP 系统强调数据库内存效率,强调内存各种指标的命令率,强调绑定变量,强系统强调数据库内存效率,强调内存各种指标的命令率,强调绑定变量,强
调并发操作。调并发操作。OLAP 系统则强调数据分析,强调系统则强调数据分析,强调SQL执行市场,强调磁盘执行市场,强调磁盘I/O,强调分区等。,强调分区等。
3))HTAP::混合事务和分析处理(混合事务和分析处理(Hybrid Transaction and
Analytical Process)),既可以应用于事务型数据库场景,亦可以应用于分析型数据库场景。,既可以应用于事务型数据库场景,亦可以应用于分析型数据库场景。GaussDB OLTP数据库数据库,业界首创,业界首创Switch Turbo技技
术,术,AZ内内TRO<1秒,满足金融场景下的数据库高可用诉求。秒,满足金融场景下的数据库高可用诉求。GaussDB OLAP数据库数据库,可以帮助客户实现,可以帮助客户实现PB级海量数据高效分析,目前已经广泛应用于级海量数据高效分析,目前已经广泛应用于
金融、运营商、政府等行业。金融、运营商、政府等行业。 GaussDB HTAP数据库数据库,多模引擎支,多模引擎支
持五种数据类型融合处理,包括流、图、空间、文本、结构化,可以解决集中式架构扩展性和性能瓶颈问题,同时分散风险,提升业务连续性。持五种数据类型融合处理,包括流、图、空间、文本、结构化,可以解决集中式架构扩展性和性能瓶颈问题,同时分散风险,提升业务连续性。
华为华为GaussDB值得关注的点:值得关注的点:
1、全球首款、全球首款AI-Native数据库。数据库。
AI原生数据库是原生数据库是GaussDB的主要特点之一。华为将的主要特点之一。华为将AI引擎内置到引擎内置到GaussDB全系产品中,使其具备一定的自运维、自管理、自调优、故障自诊断和自愈的全系产品中,使其具备一定的自运维、自管理、自调优、故障自诊断和自愈的
能力。华为也希望把在芯片、算法上面的优势,集中体现到数据库上来。客观来讲,其实对于在数据库中植入能力。华为也希望把在芯片、算法上面的优势,集中体现到数据库上来。客观来讲,其实对于在数据库中植入AI技术,并不是一个新鲜做法。技术,并不是一个新鲜做法。Oracle在在
几个版本之前就开始就植入了几个版本之前就开始就植入了AI技术,开启了技术,开启了“Autonomous”之旅。之旅。2、异构计算支持、异构计算支持X86、、ARM、、GPU、、NPU。。这个也是这个也是Gauss数据库与其他数据库数据库与其他数据库
比较大的不同。目前主流的数据库产品,包括比较大的不同。目前主流的数据库产品,包括OracleDB、、MySQL、、SQL Server等,基本都是支持等,基本都是支持X86架构。我们认为,华为数据库对于异构计算的支架构。我们认为,华为数据库对于异构计算的支
持,可能是为该数据库未来向更多计算场景的应用做准备。我们知道,持,可能是为该数据库未来向更多计算场景的应用做准备。我们知道,5G带来计算场景的变革或将更大。带来计算场景的变革或将更大。详解华为详解华为GaussDB
华为的华为的Gauss数据库现在推广的产品主要是数据库现在推广的产品主要是GaussDB100、、GaussDB 200和和GaussDB 300。我们这里主要对。我们这里主要对GaussDB 200和和GaussDB 300这两个系列这两个系列
产品进行介绍和解读。产品进行介绍和解读。华为华为GaussDB200
1、、GaussDB200 简介简介GaussDB 200是企业级的大规模并行处理关系型数据库,采用是企业级的大规模并行处理关系型数据库,采用MPP((Massively Parallel Processing)架构,支持行存储与列存)架构,支持行存储与列存
储,提供储,提供PB((Petabyte,,2的的50次方字节)级别数据量的处理能力。从以上对次方字节)级别数据量的处理能力。从以上对GaussDB的描述中,我们至少能够理解到以下几层意思:的描述中,我们至少能够理解到以下几层意思:1))GaussDB
200是一个关系型数据库,不是是一个关系型数据库,不是No-SQL数据库。数据库。2)它利用了分布式并行处理技术。早期传统数据库并不是分布式架构。分布式并行架构更适合于处理互)它利用了分布式并行处理技术。早期传统数据库并不是分布式架构。分布式并行架构更适合于处理互
联网高并发数据。联网高并发数据。3)支持行存储和列存储。这里需要解释下,数据库领域中的行存储和列存储区别。)支持行存储和列存储。这里需要解释下,数据库领域中的行存储和列存储区别。行存储(行存储(Row-based):):对于传统的关系型数据对于传统的关系型数据
剩余10页未读,继续阅读
weixin_38540819
- 粉丝: 7
- 资源: 830
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论6