亿方云CTO王成军分享:云Hbase在亿方云的实践与演进

需积分: 10 1 下载量 94 浏览量 更新于2024-07-17 收藏 5.76MB PDF 举报
亿方云科技的CTO王成军在2017年的杭州云栖大会上,分享了题为《云Hbase数据库在亿方云实践之路》的演讲,详细探讨了亿方云的产品特点、数据架构设计以及Hbase在实际项目中的应用与演进。作为亿方云的首席技术官,王成军凭借其丰富的经验背景,包括在IBM企业智能技术和阿里淘宝的技术专家经历,提供了深入洞察。 亿方云的IT架构中,云Hbase作为一种分布式、高可用的NoSQL数据库,被选为关键组件。Hbase的特点在于其动态可变的存储维度,能够灵活添加字段,支持PB级别的数据存储,且底层架构能实现自动分表路由,确保了系统的弹性和扩展性。亿方云利用Hadoop生态系统(如HDFS)作为数据存储基础,结合SQOOP进行数据装载,并通过Flume进行数据采集和传输。 在数据管理方面,亿方云构建了一套复杂且全面的体系,包括PAAS平台的文档管理、供应链数据共享、API和SDK接口、统一内容平台等,同时注重数据安全,提供权限控制和访问管理。对于海量文件的处理,系统支持实时的文件状态监控、流量统计、权限模型设定,以及对文件操作日志、用户行为和第三方数据的整合。 针对企业文件协作场景,亿方云设计了跨区域间的文件共享机制,允许不同企业间高效地创建、上传、复制文件,并实现全文检索。核心数据采用Mysql集群存储,通过企业维度进行分库管理,确保了数据的安全隔离和互访。在数据处理过程中,亿方云采用了数据集市(数据打宽)策略,通过数据加工工具如Xman和Prophet进行数据分析,支持实时和异步任务处理,同时提供交互式查询功能。 对于复杂业务场景,亿方云通过Hbase处理数据量大、业务简单且无需复杂关联查询的任务,如用户行为操作日志、WEB日志等,实现了高效的文件操作和数据服务。整体架构设计体现了亿方云对智能计算的追求,将数据平台与业务场景紧密结合,旨在提供更便捷、灵活的文件管理和数据处理解决方案。 总结来说,王成军的分享揭示了亿方云如何利用Hbase数据库在海量数据处理、分布式协作、数据安全及智能计算等方面进行实践,这是一次深度解析云计算背景下数据库技术在企业级应用中的重要角色的案例研究。