微博CacheService架构优化历程与高性能缓存选择

55 浏览量更新于2024-08-27 收藏 161KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

微博CacheService架构浅析微博作为中国最大的社交媒体平台之一，其业务处理的复杂性和规模要求一个强大的后台支持系统。每天数亿的用户请求对基础设施提出了苛刻的要求，包括： 1. 高并发能力：需要每秒处理数十万次用户请求，这就意味着系统的并发处理性能必须强大，以确保不会因为请求洪峰导致服务中断。 2. 实时数据更新：微博的信息传播速度快，数据需要实时更新，这对数据一致性管理和同步机制有着极高要求。 3. 快速响应：为了提升用户体验，服务请求的响应时间必须短，尤其是在热点事件或节假日期间，用户期待即时反馈。 4. 高可用性：99.99%以上的服务可用性是必不可少的，这意味着系统需要具备强大的容错能力和故障恢复机制。面对这样的挑战，微博开发了CacheService架构，它是一个高性能、高可用的解决方案，旨在优化数据访问，减少对后端数据库（如MySQL）的压力。最初，微博依赖于简单的MySQL架构，随着用户量的激增，这个架构变得不再适应，因为它主要依赖磁盘IO，无法提供足够的并发支持和快速响应。为了解决这个问题，微博引入了单层Cache+MySQL的架构。Cache的引入可以缓存热门数据，减轻数据库负载，提高服务速度。LocalCache作为常见的一种选择，它直接在Web应用内部提供快速访问，但数据一致性可能会受到影响，因为更新操作可能需要与后端同步，而这可能带来延迟。在选择Cache类型时，需要考虑以下因素： - 冲击性：对于微博这样的高流量平台，缓存应能快速处理瞬时高峰，比如使用Redis或Memcached等内存级缓存。 - 数据一致性：在追求速度的同时，不能忽视数据的最终一致性，可能需要采用分布式缓存系统，如Tair或Hazelcast，它们既能提供快速读取，又能通过某种策略保证数据一致性。 - 易于扩展：随着业务增长，需要有良好的扩展性，例如通过水平扩展添加更多的缓存节点。微博CacheService架构的演进过程是一个不断学习和优化的过程，它反映了技术选型和架构设计对于应对大规模用户服务的重要性。通过不断迭代，微博成功提升了系统的性能、可用性和稳定性，确保了用户的流畅体验。同时，这一案例也为其他面临类似挑战的互联网企业提供了一个有价值的参考模板。

资源详情

资源推荐

微博微博CacheService架构浅析架构浅析

微博作为国内最大的社交媒体网站之一，每天承载着亿万用户的服务请求，这些请求的背后，需要消耗着巨大的计算、内存、

网络、I/O等资源。而且因为微博的产品特性，节假日、热门事件等可能带来突发数倍甚至十几倍的访问峰值，这些都对于支

撑微博的底层基础架构提出了比较严苛的要求，需要满足：

1.每秒数十万的用户请求

2.数据更新的实时性

3.服务请求的低响应时间

4.99.99%以上的服务可用性

为了满足业务的发展需要，微博平台开发了一套高性能高可用的CacheService架构用于支撑现有线上的业务系统的运转。

但“冰动三尺非一日之寒”，微博的Cache架构也是经历了从无到有，不断的演进过程。

基于MySQL的Web架构

最初的微博系统，系统的访问量都比较小，简单的基于数据库(MySQL)已经能够满足业务需求，开发也比较简单，简单的架构

示意图如下：

随着微博的推广和名人用户入驻微博，带动了用户量的快速增长，访问量也与日俱增，这个时候，简单基于MySQL的架构已

经略感吃力，系统响应也比较缓慢，因为MySQL是一个持久化存储的解决方案，数据的读写都会经过磁盘，虽然MySQL也有

buffer pool，但是无法根据业务的特性做到很细粒度的控制，而在微博这种业务场景下，配置了SAS盘的MySQL服务单机只能

支撑几千的请求量，远小于微博的业务请求量。

基于单层Cache+MySQL的Web架构

针对请求量增大的问题，一般有几种解决方案：

1.业务架构改造，但是在这种场景下，这种方案的可行性不高。

2.MySQL进行从库扩容，虽然能够解决问题，但是带来的成本也会比较高，而且即使能够抗住请求量，但是资源的响应时间

还是无法满足期望的结果，因为磁盘的读取的响应时间要相对比较慢，普通的15000转/分钟的SAS盘的读取延迟平均要达到

2ms以上。

3.在MySQL之上架构一层缓存，把热门请求数据缓存到Cache，基于Cache+MySQL的架构来提供服务请求。

考虑到整体的改动和成本的因素，基于方案3)比较适合微博的业务场景。而应该使用什么类型的Cache比较合适呢?

比较常见的Cache解决方案有：

1.Local Cache，通过在Web应用端内嵌一个本地的Cache，这种的优势是访问比较快，但是存在的问题也比较明显，数据更

新的一致性比较难保证，因此使用的范围会有一定的限制。

2.单机版的远程Cache，通过部署一套远程的Cache服务，然后应用端请求通过网络请求与Cache交互，为了解决应用的水平

扩展和容灾问题，往往通过在client层面来实现数据的路由等。

3.分布式的Cache，Cache服务本身是一个大集群，能够提供给各种业务应用使用，并提供了一些基本的分布式特性：水平扩

展、容灾、数据一致性等等。

从系统的简单性考虑和微博场景的适用问题，最终选择了2)的方式，基于开源的Memcached来作为微博的Cache方案。

Memcached是一个分布式Cache Server，提供了key-value型数据的缓存，支持LRU、数据过期淘汰，基于Slab的方式管理内

存块，提供简单的set/get/delete等操作协议，本身具备了稳定、高性能等优点，并在业界已经得到广泛的验证。它的server端

本身是一个单机版，而分布式特性是基于client端的实现来满足，通过部署多个Memcached节点，在client端基于一致性

hash(或者其他hash策略)进行数据的分散路由，定位到具体的memcached节点再进行数据的交互。当某个节点挂掉后，对该

节点进行摘除，并把该节点的请求分散到其他的节点。通过client来实现一定程度的容灾和伸缩的能力。

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38746926

粉丝: 12
资源: 994

微博CacheService架构优化历程与高性能缓存选择

微服务架构浅析V436页.ppt

通过微博力量浅析网络舆情.doc

linux内核应用层中间层,Camera服务之--架构浅析

TCP安全问题浅析引言

浅析计算机行业发展前景

“浅析数学在金融中的运用”的选题目的意义

spring cloud-sleuth原理浅析

浅析ServiceLoader

浅析linux查看防火墙状态和对外开放的端口状态

浅析@reponsebody和@requestbody注解

浅析美国硅谷早期计算机发展历程与启示

生成随机数_浅析MT19937伪随机数生成算法

org.dozer浅析

php mysqli 源码,源码库浅析PHP 5的mysqli扩展

匹配滤波器及matlab仿真 南京理工大学顾红老师的《随机信号处理》浅析

sdio接口wifi驱动浅析

VLAN之QinQ技术浅析

SLB健康检查原理浅析

【头豹研究院】2021年浅析数字化工厂五大核心系统.pdf

Pytorch文本分类(imdb数据集)，包含DataLoader数据加载，最优模型保存

最新资源

匹配滤波器及matlab仿真南京理工大学顾红老师的《随机信号处理》浅析