第一章 认证体系介绍
阿里云认证、行业认证、专项认证
第二章 大数据简介
如何生产:移动互联网爆发、数据资产价值得到认可、存储和计算能力的发展
主要特征:体量大、类型多、有价值、变化快(真实、可视化)
数据分析流程:目的、收集、处理、分析、展现、分析报告
核心价值:侦查和预测(视频提到)
第三章 数加平台介绍
数加:阿里云大数据平台,包含了一系列的大数据产品及服务
计算引擎:离线计算(maxCompute)、流式计算(数据变化处理)(StreamCompute)、 在
线计算(AnalyticDB)
第四章 分析型数据库(AnalyticDB)
定义:是阿里巴巴自主研发的海量数据实时高并发在线分析(Realtime OLAP) 云计算服务,可
以在毫秒级针对千亿级数据进行即时的多维分析透视和 业务探索
特点:高度的计算自由、极速的响应时间、简单的使用方式、丰富的特色功能
产品特点:分档的存储、自由的查询、智能的优化、方便的接口(mysql 协议)、分层的安全、
弹性多租户
OLAP:在线分析处理,分析为主
OLTP:在线业务系统,业务为主
MPP 数据库特点:私有资源、分布式存储、分布式计算、任务并行执行、share-nothing、横
向扩展
维度表组:自动产生、只有一个、数据量小,存在关联操作多、不能删除和修改,数据库删除时才会删除
普通表组:用户手动创建、可以有多个、数据量大,关联操作少、可以删除,修改表组信息
分区是为了解决单表数据过大
默认索引即智能索引,会根据列的字段类型、取值状况来自动创建索引。
聚集列可以改变物理存储位置,实现快速查询
表组特点:
表祖是数据物理分配的最小单元。分析型数据库由许多节点组成,数据是以表组为单位部署的。
同表组内的表才可以快速 hash join。使用 hash join,要保证要么是同表组中的表,要么是由维表参与,
因为维表可以和所有的表进行关联,不受表组的限制。
同一个表组内的表共享一些配置,如超时时长、副本数,不建议修改
建议同表组中的表一级分区表一致
维表特点:
维表必须放在维表组上,不用选表组
维表的大小有限制,表的数据量不能太大
维表不需要设置分区信息
维表可以和任何表进行关联,不受表组的限制
维表保存在每个节点上,同样大小的数据,维表会消耗掉更多存储资源
事实表特点:
普通表选择表祖时需要考虑后续操作中要关联到的其他事实表。
评论1