小红书推荐系统上云实践:Hologres与Flink的融合应用

需积分: 43 6 下载量 69 浏览量 更新于2024-08-30 收藏 77.55MB PDF 举报
"小红书在推荐系统的实践中,利用阿里云的大数据技术,特别是Hologres和Flink,实现了从实时计算到数据分析的高效流程。他们成功地用Hologres替代了ClickHouse,并且深入结合Flink进行实时数据处理,将推荐系统全面云化。这一实践涵盖了实时计算在推荐业务中的应用场景、Flink的具体应用以及Hologres在OLAP(在线分析处理)中的作用。" 小红书推荐业务中的实时计算场景主要涉及用户行为的实时反馈和在线推荐引擎的快速响应。通过LogServer和客户端打点收集用户的实时行为数据,这些数据经过Kafka进行实时数据采集,然后传递给Flink进行流数据处理。Flink不仅负责实时数据的清洗和转换,还支持生成实时用户行为宽表,用于构建预测模型。同时,Flink的流处理能力也用于实时统计特征服务,确保推荐策略能够根据最新的用户行为进行动态调整。 Flink作为实时计算引擎,其在小红书推荐系统中的运用体现在多个层面。例如,它支持批流一体化,通过FLIP-27将日志转化为流数据,实现高效的数据处理。Flink的Checkpoint机制保证了数据处理的准确性和一致性,Multi-sink Optimization则提升了数据处理的效率,使得数据可以同时发送到多个目的地,如Hologres和模型训练数据存储等。此外,Flink的StreamTableEnvironment在版本1.11中引入的优化进一步增强了多sink操作的性能。 Hologres在OLAP&MC(多中心计算)场景中发挥了关键作用,作为实时在线分析处理的工具,它成功替代了ClickHouse。Hologres不仅提供了低延迟的在线查询能力,还能支持大规模的实时写入,满足了小红书实时推荐系统对数据快速响应的需求。Hologres与Flink深度集成,能够实时接收和处理来自Flink的流数据,构建实时用户行为宽表,为用户和笔记画像服务提供数据支持。同时,Hologres还用于存储和提供离线用户行为汇总表,支持离线任务如报表和实验平台的运行。 在小红书推荐的OLAP典型场景中,多计算中心的上线业务保证了系统的高可用性和容错性。通过指标验证和灰度发版,可以实时对比不同版本的性能,及时发现并解决问题。实时业务指标告警系统则确保在数据流量高峰(例如350K/s的数据速率,每个数据包含300个字段,总计32TB的存储需求)时,能够迅速响应异常情况,保障服务的稳定性和用户体验。 小红书的推荐大数据实践展示了如何巧妙地结合阿里云的Hologres和Flink技术,实现从实时数据采集到分析的一体化流程,以优化推荐效果,提升用户满意度。这一实践对于其他寻求云化转型和提升大数据处理能力的企业具有重要的参考价值。