360的HBase2.0技术革新与大规模应用实战
59 浏览量
更新于2024-08-29
收藏 623KB PDF 举报
"HBase2.0在360的技术改进与应用实践"
在360公司,HBase作为关键的数据存储系统,承担着大规模数据处理的任务。随着业务的快速发展,360部署了大规模的HBase集群,包括27个集群,其中9个在线集群和3个综合集群。总计12500个节点,单个集群最大规模达到2184个RegionServer,管理1885个表和719703个Region。这样的架构每天需要处理约3百万次请求,服务于360搜索、安全业务、360金融以及物联网(IoT)等多个核心业务领域。
针对不同业务需求,360将HBase应用分为三类:
1. 在线业务:对响应时间要求高的业务,如实时搜索和安全服务,运行在配置较高的在线集群上,避免执行批处理任务以确保高可用性和低延迟。
2. 离线业务:主要处理大量批量写入和周期性离线分析的业务,部署在配置大硬盘的离线集群,配合专门的MapReduce(MR)作业进行数据处理。
3. 综合业务:介于在线和离线之间的业务,如监控和报表,运行在综合集群,既能支持在线读写,也能运行离线分析,但可能面临资源竞争问题。
在技术改进方面,360在HBase0.89-Facebook版本基础上实现了多项优化,其中包括二级索引。原生的HBase查询主要依赖RowKey,通过get和scan操作,但仅基于RowKey查询限制了数据检索的灵活性。二级索引的引入允许用户通过非RowKey字段进行查询,扩展了HBase的查询能力,提升了业务的灵活性和效率。
此外,360可能还对HBase的性能、稳定性和扩展性进行了深度优化,例如:
- 性能优化:可能包括读写性能提升、减少延迟、提高并发处理能力等。
- 稳定性增强:通过监控和自动化运维工具确保系统的稳定运行,减少故障发生。
- 扩展性改进:可能包括RegionServer的动态扩缩容、负载均衡策略优化,以适应不断增长的数据量和业务需求。
整体而言,360在HBase2.0上的实践展现了大型互联网公司在大数据存储和处理方面的深入理解和创新应用,通过精细化的集群管理和功能增强,满足了各种复杂业务场景的需求。这些经验对于其他企业处理类似挑战具有重要的参考价值。
2023-08-28 上传
2019-08-28 上传
2019-04-10 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
2021-10-01 上传
2018-11-22 上传
点击了解资源详情
weixin_38534683
- 粉丝: 3
- 资源: 1020
最新资源
- SSM动力电池数据管理系统源码及数据库详解
- R语言桑基图绘制与SCI图输入文件代码分析
- Linux下Sakagari Hurricane翻译工作:cpktools的使用教程
- prettybench: 让 Go 基准测试结果更易读
- Python官方文档查询库,提升开发效率与时间节约
- 基于Django的Python就业系统毕设源码
- 高并发下的SpringBoot与Nginx+Redis会话共享解决方案
- 构建问答游戏:Node.js与Express.js实战教程
- MATLAB在旅行商问题中的应用与优化方法研究
- OMAPL138 DSP平台UPP接口编程实践
- 杰克逊维尔非营利地基工程的VMS项目介绍
- 宠物猫企业网站模板PHP源码下载
- 52简易计算器源码解析与下载指南
- 探索Node.js v6.2.1 - 事件驱动的高性能Web服务器环境
- 找回WinSCP密码的神器:winscppasswd工具介绍
- xctools:解析Xcode命令行工具输出的Ruby库