OSS存储与计算分离:打造云端高性能数据仓库
162 浏览量
更新于2024-08-27
收藏 637KB PDF 举报
“存储与计算分离:OSS构建表+计算引擎对接”
在当前的云计算环境中,存储与计算分离已经成为一种趋势。对象存储服务(Object Storage Service,简称OSS)是阿里云提供的一个关键组件,它不仅是用于存储图片、视频和文件的工具,还能够支持在上面构建数据表和数据仓库。OSS基于飞天分布式系统,提供了海量、安全且高可靠性的存储服务,具有RESTful API接口,并能弹性扩展容量和处理能力。
OSS不仅能够用于传统的静态数据存储,自2016年起,由于亦龙大神的贡献,Hadoop社区正式在官方版本中支持OSS,使得阿里云存储与开源生态系统更好地融合。这标志着在OSS上建立数据表成为可能。日志服务(LogHub,原SLS)进一步简化了这一过程,允许实时写入OSS上的表(如TextFile或Parquet列存储格式),并支持数据压缩和分区配置。
计算引擎方面,OSS已与阿里云的MaxCompute、E-MapReduce以及开源计算引擎如Presto实现无缝对接,用户可以根据需求灵活选择计算引擎。这种存储与计算分离的设计,使得数据处理更加灵活,且能根据工作负载动态调整资源。
选择OSS作为存储表数据的原因在于,随着技术的发展,传统的“Locality”(数据与计算紧密耦合)模型已经被更高效、更灵活的计算模式所取代,例如Impala和Presto。新的存储格式如ORC、Parquet和Kudu等列式存储和索引技术,使得计算可以更高效地处理数据,不再需要扫描大量无用信息。同时,网络架构的升级(如25G网络)、存储介质的进步(如SSD和新型闪存技术)以及计算平台的多样化(GPU、FGPA等)都在推动着存储与计算分离的进程。
存储与计算的分离使得两者可以独立发展,专注于各自的核心功能。存储服务能够专注于优化数据的存取速度和可靠性,而计算服务则可以专注于提升计算性能和效率。这种方式降低了系统对硬件设施的依赖,提高了资源利用率,并为未来的技术创新提供了更大的空间。
OSS作为云存储服务,不仅能够满足大规模的数据存储需求,还能配合各种计算引擎实现高效的分析处理。结合存储与计算分离的架构,用户可以在享受高性价比的同时,享受到更灵活、更强大的数据分析能力。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2021-09-26 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38699757
- 粉丝: 4
- 资源: 1026
最新资源
- 行业-电子-李小龙与李连杰功夫电影武打风格对比研究的说明分析.rar
- react-basic-tests-with-jest-enzyme
- Python库 | refgenconf-0.9.3.tar.gz
- lambda-billing
- 行业资料-电子功用-光电集成三维电场传感器系统的说明分析.rar
- HelsinkiFullStack:赫尔辛基大学的课程制作了FullStack课程
- 基于JavaWeb的网上订餐系统.zip
- 放鞭炮的猪猪flash动画
- Excel模板-区县妇女儿童发展规划统计监测基本情况表.rar
- 【WordPress主题】2022年最新版完整功能demo+插件v2.3.0.zip
- classAB_csdn_workspace.rar
- MedicalDevice_MiniProgram:微信小程序; 通过机智云控制设备
- 行业资料-电子功用-光电转换效率综合提高的光伏电池的说明分析.rar
- iChat ...另一个服务器/客户端模型...
- 基于SSH框架的JavaWeb租房网项目.zip
- Python库 | redvox-pandas-1.1.2.tar.gz