OSS存储与计算分离:打造云端高性能数据仓库
50 浏览量
更新于2024-08-27
收藏 637KB PDF 举报
“存储与计算分离:OSS构建表+计算引擎对接”
在当前的云计算环境中,存储与计算分离已经成为一种趋势。对象存储服务(Object Storage Service,简称OSS)是阿里云提供的一个关键组件,它不仅是用于存储图片、视频和文件的工具,还能够支持在上面构建数据表和数据仓库。OSS基于飞天分布式系统,提供了海量、安全且高可靠性的存储服务,具有RESTful API接口,并能弹性扩展容量和处理能力。
OSS不仅能够用于传统的静态数据存储,自2016年起,由于亦龙大神的贡献,Hadoop社区正式在官方版本中支持OSS,使得阿里云存储与开源生态系统更好地融合。这标志着在OSS上建立数据表成为可能。日志服务(LogHub,原SLS)进一步简化了这一过程,允许实时写入OSS上的表(如TextFile或Parquet列存储格式),并支持数据压缩和分区配置。
计算引擎方面,OSS已与阿里云的MaxCompute、E-MapReduce以及开源计算引擎如Presto实现无缝对接,用户可以根据需求灵活选择计算引擎。这种存储与计算分离的设计,使得数据处理更加灵活,且能根据工作负载动态调整资源。
选择OSS作为存储表数据的原因在于,随着技术的发展,传统的“Locality”(数据与计算紧密耦合)模型已经被更高效、更灵活的计算模式所取代,例如Impala和Presto。新的存储格式如ORC、Parquet和Kudu等列式存储和索引技术,使得计算可以更高效地处理数据,不再需要扫描大量无用信息。同时,网络架构的升级(如25G网络)、存储介质的进步(如SSD和新型闪存技术)以及计算平台的多样化(GPU、FGPA等)都在推动着存储与计算分离的进程。
存储与计算的分离使得两者可以独立发展,专注于各自的核心功能。存储服务能够专注于优化数据的存取速度和可靠性,而计算服务则可以专注于提升计算性能和效率。这种方式降低了系统对硬件设施的依赖,提高了资源利用率,并为未来的技术创新提供了更大的空间。
OSS作为云存储服务,不仅能够满足大规模的数据存储需求,还能配合各种计算引擎实现高效的分析处理。结合存储与计算分离的架构,用户可以在享受高性价比的同时,享受到更灵活、更强大的数据分析能力。
104 浏览量
2021-03-29 上传
点击了解资源详情
153 浏览量
102 浏览量
2021-09-26 上传
106 浏览量
点击了解资源详情
点击了解资源详情
weixin_38699757
- 粉丝: 4
最新资源
- CentOS7上Docker环境搭建与ELK+Elasticsearch部署指南
- JavaScript任务追踪工具task-track深度解析
- 个性黑色惊喜主题幻灯片模板下载
- EasyBCD Beta版发布:UEFI启动修复神器
- RexCrawler: Java多线程爬虫API的简易实现
- PyCharm中手动安装Flask-SQLAlchemy的离线解决方案
- AdonisJS 4.0创建简单博客教程与CRUD应用指南
- Angular开发与构建实践指南
- 腾讯短网址功能的简易网址压缩工具v1.0发布
- Struts框架应用实例:租房、宠物、学生管理项目分析
- 深入解析CSS在石丛林设计中的应用
- 情侣主题铁塔手链PPT模板下载
- STM32微控制器全面中文技术参考指南
- Java应用程序部署到Heroku的快速入门指南
- 2020年学习Spring Cloud实践案例:集成Spring Cloud Alibaba
- 商务必备:白色背景蓝色点缀5w管理法则PPT模板