小米公司HBase应用与改进探索
需积分: 15 59 浏览量
更新于2024-07-18
收藏 902KB PPTX 举报
"本文介绍了HBase在小米公司的应用情况,包括HBase集群的规模、应用场景以及小米针对HBase所做的改进和扩展。小米拥有15个HBase集群,服务于多个内部业务,如米聊消息存储、小米推送服务和MIUI离线分析等。在监控和自动化方面,小米使用Minos进行自动化部署和集中监控,并开发了故障切换测试工具。此外,小米还针对HBase的Delete语义进行了修正,以解决数据一致性和正确性的问题。未来,小米计划进一步改进HBase的跨机房备份策略,以提供更细粒度的容灾能力。"
HBase在小米的应用现状表明,它已经成为小米云平台的核心组件,支撑着众多关键业务。小米运营着15个HBase集群,其中包括9个在线集群,2个离线处理集群,以及4个测试集群,总计涉及几百台机器,每个数据节点的存储容量达到了24TB。这表明HBase在小米内部处理大量实时和离线数据的需求,如存储米聊消息、提供小米推送服务,以及支持MIUI和多看的离线分析。
在系统管理和优化方面,小米已经实现了Minos自动化部署系统,可以集中监控HBase集群,提供分类展示和表级指标聚合,而且这个系统已经被开源。此外,小米还构建了故障切换测试工具,通过ChaosMonkey+实现可配置和随机选择的操作,确保系统的高可用性。在压力和性能测试方面,小米使用Longhaul测试来评估HBase的稳定性和性能。
针对HBase的Delete语义问题,小米发现并修复了一个潜在的数据一致性问题。原本的Delete操作可能会屏蔽后来写入的数据,这与用户的预期不符。为了解决这个问题,小米提出了一种新的Delete语义,确保Delete标志只能影响其写入时间之前的数据,不会影响到后续写入的数据,这一改变已经在Apache HBase的JIRA问题跟踪器中记录为HBASE-8721。
在未来的规划中,小米注意到HBase当前的跨机房备份策略仅限于整个集群级别的备份,这可能限制了备份的灵活性和恢复的粒度。因此,小米计划改进这一策略,实现更可控、更细粒度的跨机房备份,以提高数据的安全性和服务的连续性。
HBase在小米的应用不仅展示了其在大数据处理领域的强大能力,也体现了小米在大数据基础设施上的深度定制和优化能力,以及对数据一致性、可用性和容灾性的重视。
2014-05-29 上传
2019-11-09 上传
130 浏览量
2019-08-28 上传
2023-09-09 上传
点击了解资源详情
点击了解资源详情
dataminner
- 粉丝: 2
- 资源: 3
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜