AI 科技评论编者按:现在,越来越多的企业、高校以及学术组织机构通过举办各种类型的数据竞赛来「物色」数据科学
领域的优秀人才,并借此激励他们为某一数据领域或应用场景找到具有突破性意义的方案,也为之后的数据研究者留下
有价值的经验。
Smilexuhc 在 GitHub 社区对各大数据竞赛名列前茅的解决方案进行了整理,包括纯数据竞赛、自然语言处理(NLP)
领域数据赛事的 Top 解决方案。对这些赛事感兴趣的小伙伴可以一起来看一下这篇干货满满的汇总贴:
纯数据竞赛
1.2018 科大讯飞 AI 营销算法大赛
本次大赛要求参赛者基于提供的讯飞 AI 营销云的海量广告投放数据,通过人工智能技术构建来预测模型预估用户的广
告点击概率。比赛提供了 5 类数据,包括基础广告投放数据、广告素材信息、媒体信息、用户信息和上下文信息,总共
为 1001650 初赛数据 和 1998350 条复赛数据(复赛训练数据为:初赛数据+复赛数据)。
Rank1:https://zhuanlan.zhihu.com/p/47807544
2.2018 IJCAI 阿里妈妈搜索广告转化预测
本次比赛要求参赛者以阿里电商广告为研究对象,基于提供的淘宝平台的海量真实交易数据,通过人工智能技术构建来
预测模型预估用户的购买意向。本次比赛为参赛者提供了 5 类数据,包括基础数据、广告商品信息、用户信息、上下文
信息和店铺信息。用于初赛的数据包含了若干天的样本;最后一天的数据用于结果评测,对选手不公布;其余日期的数
据作为训练数据,提供给参赛选手。
Rank1:https://github.com/plantsgo/ijcai-2018
Rank2:https://github.com/YouChouNoBB/ijcai-18-top2-single-mole-solution
https://blog.csdn.net/Bryan__/article/details/80600189
Rank3: https://github.com/luoda888/2018-IJCAI-top3
Rank8: https://github.com/fanfanda/ijcai_2018
Rank8: https://github.com/Gene20/IJCAI-18
Rank9(第一赛季):https://github.com/yuxiaowww/IJCAI-18-TIANCHI
3.2018 腾讯广告算法大赛
本次算法大赛的题目源自一个基于真实业务场景的广告技术产品——腾讯社交广告 Lookalike 相似人群拓展。本题目要
求参赛者基于提供的几百个种子人群、海量候选人群对应的用户特征,以及种子人群对应的广告特征,构建算法准确标