没有合适的资源?快使用搜索试试~ 我知道了~
首页2023年星环科技TDH数据中台建设方案详解
本篇文档为2023年数据中台建设的详细方案,旨在解决智慧城市中的大数据服务需求。方案首先概述了整体建设目标,强调了对星环科技TranswarpDataHub (TDH) 大数据基础平台的选择,这是一种基于TranswarpOperatingSystem (TOS) 云平台架构的设计。 TDH大数据平台的核心在于其性能优化和稳定性提升。它基于开源Spark技术,星环科技对查询引擎、计算框架、存储引擎和资源调度进行了改良,尤其是Inceptor分布式计算引擎,解决了Spark的稳定性问题,同时提供了高达开源版本2-10倍的计算性能。TDH Inceptor确保了在大规模生产环境中长时间稳定运行,并能处理TB级数据的复杂分析任务。 TDH平台支持多种数据类型,包括结构化、非结构化和半结构化数据,适用于配置、日志、网页、音视频、社交网络等多个来源的数据整合。平台提供全面的数据处理模式,如数据查询、全文检索、实时流处理以及机器学习等,满足企业的多元化数据需求。此外,平台还具备多租户功能,对计算、存储和数据访问资源进行统一管理和权限控制,确保数据安全和资源高效利用。 星环云操作系统TOS作为底层支撑,为TDH提供了稳定可靠的运行环境,简化了安装、配置、监控和运维过程。TOS使得平台能适应企业不同规模的数据处理需求,从10GB到100PB的数据都能高效处理,且能实现动态扩展,避免了传统MPP或混合架构在数据增长时可能出现的复杂迁移问题。 这份2023年数据中台建设方案,通过星环科技的TDH和TOS组合,为企业构建了一个强大、灵活且稳定的数据处理基础设施,旨在驱动智慧城市的智能化发展,提高决策效率和业务敏捷性。
资源详情
资源推荐
![](https://csdnimg.cn/release/download_crawler_static/88504308/bg10.jpg)
12
1.1.3.5. 容器技术和 Kubernetes 资源管理
TDH 中的组件都针对 Docker 作了优化,计算引擎也可以使用 Kubernetes 进行
资源管理,得以使 TDH 以较低 的成本部署在公共云或者私有云上。星环还充分
利用 Docker 和 Kubernetes 的资源隔离能力和对资源调度的 QoS 支持,提供了弹
性的资源共享,保障数据、资源、应用之间的隔离,实现了更好地多租户管理,以支
持各种不 同的业务需求。
容器技术给 TDH 的部署和维护带来了非常显著的提升,它支持动态扩容、缩
容,支持灰度升级,可以实现在 不停服的情况下对系统进行升级
![](https://csdnimg.cn/release/download_crawler_static/88504308/bg11.jpg)
13
![](https://csdnimg.cn/release/download_crawler_static/88504308/bg12.jpg)
14
1.1.3.6. 生态系统的强力整合
TDH 非常重视与数据分析生态系统的整合以提高系统的易用性。TDH 与现
有成熟系统的无缝整合涉及了数据获取,数据分析以及数据可视化端。传统的关
系型数据库的数据可以直接作为数据源接入到集群中参与计算分析,目前已经支
持 Oracle,DB2 及 MySQL 数据库。数据分析层与 R 语言的整合带来了 R 的数
千种统计算法的同时,可以充分利用 R 语言中的绘图工具绘制专业的统计报表;
数据可视化不仅可将最终分析结果展示给用户,还可以帮助数据分析师来进行数
据探索来发现和解决新问题。TDH 支持多种可视化及报表生成工具,包括 Tableau、
SAP Business Objects、Oracle OBIEE 等,使得基于大数据分析的商业决策更易被
理解和接受,从而将大数据的潜在价值最大化。虽然有些工具也支持 Apache
Hadoop,但只有高性能的 TDH 才真正使得交互式地探索大数据成为现实。
1.1.3.7. 完备的企业级解决方案
![](https://csdnimg.cn/release/download_crawler_static/88504308/bg13.jpg)
15
TDH 通过提供数据存储、分布式计算、数据分析挖掘以及数据可视化的整套
支持,解决了企业在 GB 到 PB 级数据分析领域碰到的各种问题。作为企业级解
决方案,可管理性是 TDH 的显著优势,用户友好的管理界面提供了系统安装、
系统及集群配置、监控及预警等多方面的一站式支持。TDH 架构具有高可用性
和快速故障恢复能力,HDFS2.5 做为其底层存储系统的支撑技术(Hyperbase 亦
基于此)保证了数据的持久化和冗余复制,并具有数据自动检测和修复的容错功
能;基于 HDFS 的所有服务为 HDFS 2.5 的 HA 功能而优化,确保整个大数据处
理系统的高可用性。在安全领域,与 Kerberos/LDAP 进行整合,支持细粒度访问
控制、应用程序安全及数据加密及解密等等。
1.1.4. 大数据平台性能优化
1.1.4.1. TDH 计算框架优化
星环支持多种主流的分布式计算框架,包括 MapReduce 和 Spark,并且在产
品设计之初就将 Spark 作为整个产品的缺省计算框架,多年来在计算框架方面做
了大量的优化工作,提高了其性能与稳定性。
1.1.4.1.1. MapReduce
MapReduce 是一个分布式计算框架,基于该框架能够容易地编写分布式应用
程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种可
靠地,具有容错能力的方式并行地处理上 TB 级别的海量数据集。
MapReduce 擅长处理大数据,该计算框架的核心思想就是“分而治之”,整个计
算过程可以分解为 Map(分)与 Reduce(合)两个阶段。首先,将复杂的任务
分解为若干个简单的小任务来处理。其中简单的小任务包含三层含义:一是数据
或计算的规模相对原任务要大大缩小;二是就近计算原则,即任务会被分配到存
放着所需数据的节点上进行计算;三是这些小任务可以并行计算,彼此之间没有
依赖关系。Reducer 负责对 map 阶段的结果进行汇总。
![](https://csdnimg.cn/release/download_crawler_static/88504308/bg14.jpg)
16
1.1.4.1.2. Spark
Spark 是 UC Berkeley AMP lab(加州大学伯克利分校的 AMP 实验室)所开
源的类 Hadoop MapReduce 的通用并行框架,Spark 拥有 Hadoop
剩余286页未读,继续阅读
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/43b6865d0d204993a8c66f2897f313e2_zuoan1993.jpg!1)
公众号:智慧方案文库
- 粉丝: 2284
- 资源: 1万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 电力电子系统建模与控制入门
- SQL数据库基础入门:发展历程与关键概念
- DC/DC变换器动态建模与控制方法解析
- 市***专有云IaaS服务:云主机与数据库解决方案
- 紫鸟数据魔方:跨境电商选品神器,助力爆款打造
- 电力电子技术:DC-DC变换器动态模型与控制
- 视觉与实用并重:跨境电商产品开发的六重价值策略
- VB.NET三层架构下的数据库应用程序开发
- 跨境电商产品开发:关键词策略与用户痛点挖掘
- VC-MFC数据库编程技巧与实现
- 亚马逊新品开发策略:选品与市场研究
- 数据库基础知识:从数据到Visual FoxPro应用
- 计算机专业实习经验与项目总结
- Sparkle家族轻量级加密与哈希:提升IoT设备数据安全性
- SQL数据库期末考试精选题与答案解析
- H3C规模数据融合:技术探讨与应用案例解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)