腾讯推荐系统中的TRecall分布式索引平台

版权申诉
0 下载量 65 浏览量 更新于2024-06-23 收藏 2.78MB PDF 举报
“分布式索引系统架构实践.pdf”是关于推荐系统技术分享的文档,主要介绍了腾讯推荐系统的专场分享,由欧阳金华讲述。该系统聚焦于处理海量数据的分布式引擎架构,特别是TRecall这一高性能、低成本、高时效性的分布式索引平台。 TRecall平台在推荐系统中的作用在于提供统一的倒排召回服务,适用于推荐和类推荐场景。它具备以下关键特性: 1. 高性能:在处理百亿级别的文档和千万级别的QPS(Queries Per Second,每秒查询率)时,平均响应时间控制在10毫秒以内,确保快速的召回效率。 2. 高可用性:在高并发大流量的环境下,系统具备强大的故障切换能力,接口的可用性SLI(Service Level Indicator,服务级别指标)不低于99.99%,保证服务稳定性。 3. 高扩展性:面对业务数据和请求的频繁变化,系统支持动态扩缩容,以最大限度地节约成本。 4. 高实时性:支持doc级别和字段级别的增量索引,更新可在秒级生效,全量索引则支持天、半天或小时多层级构建。此外,系统还支持插件池的离线索引构建和在线召回,便于快速开发与迭代。 5. 算子库:提供易于理解的类SQL召回语法,包含丰富的内嵌算子和可扩展算子集合,方便进行召回策略的定制。 6. AB实验:支持低成本的索引AB、正排AB、文档AB实验,以及插件AB能力,促进快速迭代和优化。 7. 运营能力:提供一站式运营系统,包括配套工具箱、自助文档、视频教程和示例Demo,实现全托管服务,包括集群运维、版本升级、监控报警和故障响应。 8. 应用场景广泛:覆盖了多种推荐场景,如评论、帖子、弹幕、频道筛选、关注收藏等,服务于数十家业务场景,日调用量达百亿级别,推荐场景的P99耗时低于10ms,万次检索成本低,单集群文档量级超过100亿。 9. 接口多样性:支持推荐类、全链计数类、流式接口,并可以选择fbs或pb协议,满足不同需求。 整体架构上,TRecall基于lambda架构,实现了读写分离,即离线写入和在线读取,结合流式和批量更新,定期进行全量构建和离线增量更新,确保数据的实时性和一致性。 通过这样的分布式索引系统架构,TRecall不仅提升了推荐系统的效率和稳定性,还降低了运营成本,成为推荐系统中不可或缺的关键组件。