没有合适的资源?快使用搜索试试~ 我知道了~
首页星环科技TDH大数据平台与TOS云操作系统构建10万字数据中台方案
本235页的10万字数据中台建设方案详细探讨了如何构建一个高效、稳定且全面的大数据平台。方案以星环科技的TranswarpDataHub (TDH) 大数据基础平台为核心,结合TranswarpOperatingSystem (TOS) 云平台技术,为智慧城市和人工智能领域的客户提供解决方案。 首先,方案强调了TDH的选择,它基于Spark开源技术进行深度优化,特别提到的分布式计算引擎Inceptor增强了Spark的稳定性,解决了一些常见问题,并且在实际项目中经受住了考验,提供了2-10倍于开源版本的计算性能。Inceptor确保了平台在大规模数据(TB级)上的稳定统计分析,支持企业7*24小时不间断运行。 TDH平台设计灵活,兼容结构化、非结构化和半结构化数据,适用于多源异构数据处理,包括配置、日志、网页、音视频、社交网络等。其功能强大,涵盖了数据查询、全文检索、批处理分析、实时流处理、图分析、数据挖掘和机器学习等多元应用场景。此外,它具有完善的多租户功能,通过统一的TranswarpManager进行资源管理和运维,对计算、存储和数据访问权限进行精细化控制。 方案还重点介绍了TOS云操作系统,作为平台的基石,TOS提供了统一的安装、配置、监控和告警管理,简化了运维工作,使得企业在数据量不断增长的情况下,无需频繁迁移或更换架构,能够通过动态扩容实现无缝扩展,避免了复杂的数据迁移问题。 这份方案不仅涵盖了数据中台的架构设计,还包括了关键技术选型、性能优化、资源管理和运维保障等内容,为企业构建高效数据处理环境提供了详尽的指导,特别是在智慧城市和人工智能领域,这种数据驱动的能力将极大地推动业务创新和决策支持。
资源详情
资源推荐
![](https://csdnimg.cn/release/download_crawler_static/88419082/bg10.jpg)
12
1.1.3.5. 容器技术和 Kubernetes 资源管理
TDH 中的组件都针对 Docker 作了优化,计算引擎也可以使用 Kubernetes 进行
资源管理,得以使 TDH 以较低 的成本部署在公共云或者私有云上。星环还充分
利用 Docker 和 Kubernetes 的资源隔离能力和对资源调度的 QoS 支持,提供了弹
性的资源共享,保障数据、资源、应用之间的隔离,实现了更好地多租户管理,以支
持各种不 同的业务需求。
容器技术给 TDH 的部署和维护带来了非常显著的提升,它支持动态扩容、缩
容,支持灰度升级,可以实现在 不停服的情况下对系统进行升级
![](https://csdnimg.cn/release/download_crawler_static/88419082/bg11.jpg)
13
1.1.3.6. 生态系统的强力整合
TDH 非常重视与数据分析生态系统的整合以提高系统的易用性。TDH 与现
有成熟系统的无缝整合涉及了数据获取,数据分析以及数据可视化端。传统的关
系型数据库的数据可以直接作为数据源接入到集群中参与计算分析,目前已经支
持 Oracle,DB2 及 MySQL 数据库。数据分析层与 R 语言的整合带来了 R 的数
千种统计算法的同时,可以充分利用 R 语言中的绘图工具绘制专业的统计报表;
数据可视化不仅可将最终分析结果展示给用户,还可以帮助数据分析师来进行数
据探索来发现和解决新问题。TDH 支持多种可视化及报表生成工具,包括 Tableau、
SAP Business Objects、Oracle OBIEE 等,使得基于大数据分析的商业决策更易被
理解和接受,从而将大数据的潜在价值最大化。虽然有些工具也支持 Apache
Hadoop,但只有高性能的 TDH 才真正使得交互式地探索大数据成为现实。
1.1.3.7. 完备的企业级解决方案
![](https://csdnimg.cn/release/download_crawler_static/88419082/bg12.jpg)
14
TDH 通过提供数据存储、分布式计算、数据分析挖掘以及数据可视化的整套
支持,解决了企业在 GB 到 PB 级数据分析领域碰到的各种问题。作为企业级解
决方案,可管理性是 TDH 的显著优势,用户友好的管理界面提供了系统安装、
系统及集群配置、监控及预警等多方面的一站式支持。TDH 架构具有高可用性
和快速故障恢复能力,HDFS2.5 做为其底层存储系统的支撑技术(Hyperbase 亦
基于此)保证了数据的持久化和冗余复制,并具有数据自动检测和修复的容错功
能;基于 HDFS 的所有服务为 HDFS 2.5 的 HA 功能而优化,确保整个大数据处
理系统的高可用性。在安全领域,与 Kerberos/LDAP 进行整合,支持细粒度访问
控制、应用程序安全及数据加密及解密等等。
1.1.4. 大数据平台性能优化
1.1.4.1. TDH 计算框架优化
星环支持多种主流的分布式计算框架,包括 MapReduce 和 Spark,并且在产
品设计之初就将 Spark 作为整个产品的缺省计算框架,多年来在计算框架方面做
了大量的优化工作,提高了其性能与稳定性。
1.1.4.1.1. MapReduce
MapReduce 是一个分布式计算框架,基于该框架能够容易地编写分布式应用
程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种可
靠地,具有容错能力的方式并行地处理上 TB 级别的海量数据集。
MapReduce 擅长处理大数据,该计算框架的核心思想就是“分而治之”,整个计
算过程可以分解为 Map(分)与 Reduce(合)两个阶段。首先,将复杂的任务
分解为若干个简单的小任务来处理。其中简单的小任务包含三层含义:一是数据
或计算的规模相对原任务要大大缩小;二是就近计算原则,即任务会被分配到存
放着所需数据的节点上进行计算;三是这些小任务可以并行计算,彼此之间没有
依赖关系。Reducer 负责对 map 阶段的结果进行汇总。
![](https://csdnimg.cn/release/download_crawler_static/88419082/bg13.jpg)
15
1.1.4.1.2. Spark
Spark 是 UC Berkeley AMP lab(加州大学伯克利分校的 AMP 实验室)所开
源的类 Hadoop MapReduce 的通用并行框架,Spark 拥有 Hadoop
![](https://csdnimg.cn/release/download_crawler_static/88419082/bg14.jpg)
15
MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保
存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与
机器学习等需要迭代的 MapReduce 的算法。
Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一
些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,
换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可
以优化迭代工作负载。
Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架。与 Hadoop
不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样
轻松地操作分布式数据集。
1.1.4.1.3. 计算引擎优化
星环科技基于开源 Spark 技术,改进的分布式计算引擎 Inceptor,解决了开
源 Spark 的稳定性问题,并且已经在众多成功案例中经历了的考验。同时 Ipcetor
大幅提高 Spark 计算性能,是开源的 2-10 倍。TDH Inceptor 极大提高了 Spark 功
能和性能的稳定性,可以 7*24 小时在企业的生产环境运行,并能在 TB 级规模
数据上高效进行各种稳定的统计分析。
Inceptor 基于 Apache Spark 深度开发了专用分布式计算引擎,不仅大幅提高
了计算性能,而且有效的解决了 Spark 在稳定性方面的很多问题,确保计算引擎
能够 7x24 小时无间断运行。此外,Inceptor 引擎独立构建了分布式数据层,将计
算数据从计算引擎 JVM 内存空间中独立出来,因此可以有效减少 JVM GC 对系
统性能和稳定性的影响。
在 SQL 执行计划优化方面,Inceptor 实现了基于代价的优化器和基于规则的
优化器,辅以 100 多种优化规则,可以保证 SQL 应用在无需手工改动的情况下
能够发挥最大的性能。对于数据倾斜等常见的数据处理难题,执行引擎也能够自
动识别并加以优化,能够解决绝大部分存在数据倾斜的计算场景,杜绝数据倾斜
对系统稳定性的影响。
剩余284页未读,继续阅读
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/43b6865d0d204993a8c66f2897f313e2_zuoan1993.jpg!1)
公众号:智慧方案文库
- 粉丝: 2290
- 资源: 1万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 构建智慧路灯大数据平台:物联网与节能解决方案
- 智慧开发区建设:探索创新解决方案
- SQL查询实践:员工、商品与销售数据分析
- 2022智慧酒店解决方案:提升服务效率与体验
- 2022年智慧景区信息化整体解决方案:打造数字化旅游新时代
- 2022智慧景区建设:大数据驱动的5A级管理与服务升级
- 2022智慧教育综合方案:迈向2.0时代的创新路径与实施策略
- 2022智慧教育:构建区域教育云,赋能学习新时代
- 2022智慧教室解决方案:融合技术提升教学新时代
- 构建智慧机场:2022年全面信息化解决方案
- 2022智慧机场建设:大数据与物联网引领的生态转型与客户体验升级
- 智慧机场2022安防解决方案:打造高效指挥与全面监控系统
- 2022智慧化工园区一体化管理与运营解决方案
- 2022智慧河长管理系统:科技助力水环境治理
- 伪随机相位编码雷达仿真及FFT增益分析
- 2022智慧管廊建设:工业化与智能化解决方案
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)