Kaggle OTTO多目标推荐竞赛19th总结：召回+精排策略与特征分析

下载需积分: 0 | PDF格式 | 131KB | 更新于2024-08-03 | 87 浏览量 | 举报

该文档是关于2023年2月4日Kaggle OTTO多目标推荐竞赛的19th版本赛后总结，提供了详细的方案分析和竞赛策略。竞赛参与者采用了召回+精排的双阶段模型来提升推荐效果。首先，他们通过本地交叉验证（localcv），在训练集上使用前3周的数据，验证集用第4周的数据进行调整，实现了公共 LB（0.585）和私人 LB（0.585）的召回指标。在召回阶段，他们采用的方法包括： 1. 每个会话召回100个候选商品（AIDs），通过历史交互记录、基于开源笔记本的i2i交互策略，以及填充最热门商品来构建候选列表。 2. 重要的i2i改进包括引入顺序权重，即在交互序列中考虑相邻商品的权重，并在i2i和u2i阶段都应用这一规则。 3. 正则化的 i2i 方法通过计算相似度字典，降低热门商品的权重，确保每个候选商品的i2i得分与其所在候选集中其他商品的平均分相比。精排模型方面，使用了LightGBM Ranker模型，带有182个特征，采用0.2的负采样率。模型包含丰富的用户特征，如事件计数、类型计数、时间范围等，商品特征包括种类计数、时间特定性（如促销活动）、转化率、重复购买行为和首次/最后出现时间等。交互特征也涵盖了各类计数和衰减计数，以捕捉用户行为的时序性和关联性。此外，团队还尝试了集成学习方法，通过5个不同种子的负采样，对具有相同特征的LightGBM Ranker进行了组合，最终达到了相同的公共和私人 LB（0.601）。总体来说，这份总结揭示了参赛者在Kaggle OTTO多目标推荐竞赛中的关键策略和技术细节，对于理解多目标推荐问题以及如何优化模型性能具有很高的参考价值。

Kaggle OTTO 多目标推荐 19th 赛后总结

 召回 + 精排两阶段模型

 local cv: train on week3/ valid on week 4

 纯召回LB: 0.585(pulic LB)/0.585(private LB)

 精排模型: lightgbm ranker with 182 features. 0.601(public

LB)/0.600(private LB))

 ensemble: 5 个不同种子做负采样的相同特征的 lightgbm

ranker ( 0.601(public LB)/0.601(private LB))

召回

 每个session召回100个候选aids

 历史交互aids

 i2i2i based on 开源notebook

 最热门的商品去填满100个候选集

 local cv on week4 [LB 0.585]

num of

candidates

click

cart

order

sum

0.539

0.422

0.6580

0.575

0.622

0.483

0.6949

0.624

100

0.674

0.526

0.7188

0.656

 主要 i2i 改进

下载后可阅读完整内容，剩余3页未读，立即下载

白话机器学习

粉丝: 1w+

Kaggle OTTO多目标推荐竞赛19th总结：召回+精排策略与特征分析

Kaggle OTTO 推荐系统比赛方案解析

Kaggle Otto推荐系统源码解析与实践

Kaggle Otto挑战赛：数据集解读与学习

[] - 2023-10-11 大模型Kaggle比赛首秀金牌总结.pdf

[] - 2023-05-28 3 X Kaggle GM分享数据科学的成长学习过程.pdf

[] - 2023-03-04 RSNA比赛总结—kaggle 高效摸牌套路.pdf

[] - 2023-02-16 Kaggle Topk商品推荐方案总结.pdf

kaggle-avazu-rank2.zip_kaggle_kaggle rank_kaggle比赛_rank2_亚马逊

[] - 2023-02-26 盘点Kaggle中常见的AutoML工具库.pdf

[] - 2023-07-21 2023 Kaggle AMP帕金森进展预测金牌方案！.pdf

最新资源