Kaggle OTTO多目标推荐竞赛19th总结:召回+精排策略与特征分析
需积分: 0 55 浏览量
更新于2024-08-03
收藏 131KB PDF 举报
该文档是关于2023年2月4日Kaggle OTTO多目标推荐竞赛的19th版本赛后总结,提供了详细的方案分析和竞赛策略。竞赛参与者采用了召回+精排的双阶段模型来提升推荐效果。首先,他们通过本地交叉验证(localcv),在训练集上使用前3周的数据,验证集用第4周的数据进行调整,实现了公共 LB(0.585)和私人 LB(0.585)的召回指标。
在召回阶段,他们采用的方法包括:
1. 每个会话召回100个候选商品(AIDs),通过历史交互记录、基于开源笔记本的i2i交互策略,以及填充最热门商品来构建候选列表。
2. 重要的i2i改进包括引入顺序权重,即在交互序列中考虑相邻商品的权重,并在i2i和u2i阶段都应用这一规则。
3. 正则化的 i2i 方法通过计算相似度字典,降低热门商品的权重,确保每个候选商品的i2i得分与其所在候选集中其他商品的平均分相比。
精排模型方面,使用了LightGBM Ranker模型,带有182个特征,采用0.2的负采样率。模型包含丰富的用户特征,如事件计数、类型计数、时间范围等,商品特征包括种类计数、时间特定性(如促销活动)、转化率、重复购买行为和首次/最后出现时间等。交互特征也涵盖了各类计数和衰减计数,以捕捉用户行为的时序性和关联性。
此外,团队还尝试了集成学习方法,通过5个不同种子的负采样,对具有相同特征的LightGBM Ranker进行了组合,最终达到了相同的公共和私人 LB(0.601)。
总体来说,这份总结揭示了参赛者在Kaggle OTTO多目标推荐竞赛中的关键策略和技术细节,对于理解多目标推荐问题以及如何优化模型性能具有很高的参考价值。
2023-12-02 上传
2023-12-06 上传
2023-12-06 上传
2023-12-06 上传
2022-09-21 上传
2023-12-06 上传
白话机器学习
- 粉丝: 1w+
- 资源: 7671
最新资源
- SSM Java项目:StudentInfo 数据管理与可视化分析
- pyedgar:Python库简化EDGAR数据交互与文档下载
- Node.js环境下wfdb文件解码与实时数据处理
- phpcms v2.2企业级网站管理系统发布
- 美团饿了么优惠券推广工具-uniapp源码
- 基于红外传感器的会议室实时占用率测量系统
- DenseNet-201预训练模型:图像分类的深度学习工具箱
- Java实现和弦移调工具:Transposer-java
- phpMyFAQ 2.5.1 Beta多国语言版:技术项目源码共享平台
- Python自动化源码实现便捷自动下单功能
- Android天气预报应用:查看多城市详细天气信息
- PHPTML类:简化HTML页面创建的PHP开源工具
- Biovec在蛋白质分析中的应用:预测、结构和可视化
- EfficientNet-b0深度学习工具箱模型在MATLAB中的应用
- 2024年河北省技能大赛数字化设计开发样题解析
- 笔记本USB加湿器:便携式设计解决方案