50万QPS下微博未读数系统设计挑战与解决方案

需积分: 0 18 浏览量更新于2024-08-05 收藏 472KB PDF 举报

在本篇关于计数系统设计的文章中，作者唐扬着重讨论了在高并发场景下，尤其是50万QPS的挑战下，如何设计一个高效的未读数系统。首先，他强调了缓存技术在提升系统性能和抵抗并发量中的关键作用，以及在上一节课中所介绍的通用计数系统的基础架构，包括使用Redis等技术处理万亿级计数数据和百万级读取请求。文章提到，常规的未读数计数可以应用通用计数系统的原理，通过用户ID作为键，在内存区域存储用户的未读消息类型（如@、评论等）的数量。用户查看相应通知时，计数会被重置为零。然而，当涉及到系统通知的未读数时，通用计数方案不再适用。因为随着用户数量的增长，逐个更新每个用户未读通知计数会带来问题：全量用户查询消耗大量时间，对数据库压力大，响应时间过长，这对实时性要求高的在线业务来说是不可接受的。为解决这个问题，文章提出了一种折中的方法：预先从数据仓库获取所有用户的ID，并存储在本地文件中，然后在发送系统通知时，通过轮询的方式更新这些用户的未读计数。这种方法虽然减少了数据库查询，但仍然需要定时同步数据仓库，确保数据的实时性。此外，文章还提到了早期微博版本中的系统通知功能，它会向所有用户推送消息，如果没有被查看，系统会记录未读状态。这种设计需要额外考虑用户体验和通知效率，尤其是在大规模用户场景下，如何平衡推送频率和通知质量是一大挑战。本文探讨了在高并发环境下的未读数系统设计，不仅关注了基础的计数技术，还深入剖析了系统通知场景下的特殊需求和优化策略。对于从事IT系统设计的学生或开发者来说，这是一个实战型的宝贵案例，可以帮助理解如何处理复杂的并发问题和优化性能瓶颈。

38-计数系统设计（⼆）：50万QPS下如何设计未读数系统？38-计数系统设计（⼆）：50万QPS下如何设计未读数系统？

你好，我是唐扬。

在上⼀节课中我带你了解了如何设计⼀套⽀撑⾼并发访问和存储⼤数据量的通⽤计数系统，我们通过缓存技

术、消息队列技术以及对于Redis的深度改造，就能够⽀撑万亿级计数数据存储以及每秒百万级别读取请求

了。然⽽有⼀类特殊的计数并不能完全使⽤我们提到的⽅案，那就是未读数。

未读数也是系统中⼀个常⻅的模块，以微博系统为例，你可看到有多个未读计数的场景，⽐如：

那当你遇到第⼀个需求时，要如何记录未读数呢？其实，这个需求可以⽤上节课提到的通⽤计数系统来实

现，因为⼆者的场景⾮常相似。

你可以在计数系统中增加⼀块⼉内存区域，以⽤⼾ID为Key存储多个未读数，当有⼈@你时，增加你的未读

@的计数；当有⼈评论你时，增加你的未读评论的计数，以此类推。当你点击了未读数字进⼊通知⻚⾯，查

看@你或者评论你的消息时，重置这些未读计数为零。相信通过上⼀节课的学习，你已经⾮常熟悉这⼀类

系统的设计了，所以我不再赘述。

那么系统通知的未读数是如何实现的呢？我们能⽤通⽤计数系统实现吗？答案是不能的，因为会出现⼀些问

题。

系统通知的未读数要如何设计系统通知的未读数要如何设计

来看具体的例⼦。假如你的系统中只有A、B、C三个⽤⼾，那么你可以在通⽤计数系统中增加⼀块⼉内存区

域，并且以⽤⼾ID为Key来存储这三个⽤⼾的未读通知数据，当系统发送⼀个新的通知时，我们会循环给每

⼀个⽤⼾的未读数加1，这个处理逻辑的伪代码就像下⾯这样：

这样看来，似乎简单可⾏，但随着系统中的⽤⼾越来越多，这个⽅案存在两个致命的问题。

⾸先，获取全量⽤⼾就是⼀个⽐较耗时的操作，相当于对⽤⼾库做⼀次全表的扫描，这不仅会对数据库造成

很⼤的压⼒，⽽且查询全量⽤⼾数据的响应时间是很⻓的，对于在线业务来说是难以接受的。如果你的⽤⼾

库已经做了分库分表，那么就要扫描所有的库表，响应时间就更⻓了。不过有⼀个折中的⽅法，不过有⼀个折中的⽅法，那就是在

发送系统通知之前，先从线下的数据仓库中获取全量的⽤⼾ID，并且存储在⼀个本地的⽂件中，然后再轮询

所有的⽤⼾ID，给这些⽤⼾增加未读计数。

当有⼈@你、评论你、给你的博⽂点赞或者给你发送私信的时候，你会收到相应的未读提醒；

在早期的微博版本中有系统通知的功能，也就是系统会给全部⽤⼾发送消息，通知⽤⼾有新的版本或者有

⼀些好玩的运营活动，如果⽤⼾没有看，系统就会给他展⽰有多少条未读的提醒。

我们在浏览信息流的时候，如果⻓时间没有刷新⻚⾯，那么信息流上⽅就会提⽰你在这段时间有多少条信

息没有看。

List<Long>userIds=getAllUserIds();

for(Longid:userIds){

incrUnreadCount(id);

}

下载后可阅读完整内容，剩余5页未读，立即下载

CyberNinja

粉丝: 29
资源: 297

50万QPS下微博未读数系统设计挑战与解决方案

23-RPC框架：10万QPS下如何实现毫秒级的服务调用？_For_group_share1

30-给系统加上眼睛：服务端监控要怎么做？_For_group_share1

21-系统架构：每秒1万次请求的系统要做服务化拆分吗？_For_group_share1

qps:高性能 qps 计数器

yarn-auditlog-parser:Yarn的hdfs-audit.log的日志文件解析，从ip,用户名，时间段维度对hdfs的qps量进行统计

log-monitor:基于日志的统计qps和cost_time

LURK-Cache源码分析：优化QPS激增下的系统性能

理解系统吞吐量：TPS、QPS、并发数与性能测试

淘宝前台系统优化：提升单机QPS与吞吐量

互联网高并发系统架构设计：响应时间与QPS优化

最新资源