电商机器学习实践：从爆款到个性化模型的演进

需积分: 0 177 浏览量更新于2024-08-05 收藏 552KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"本文主要介绍了机器学习在电商领域的应用，特别是如何通过模型迭代来优化商品排序，提升电商的GMV转化率和流量利用率。作者吴海波分享了他在蘑菇街的工作经验，提出了爆款模型、转化率模型和个性化模型在不同业务阶段的作用。" 在电商行业中，机器学习扮演着至关重要的角色，尤其是在推荐、搜索和广告这三个关键领域。其中，商品排序是这些领域共同面临的挑战。目标是通过优化排序，最大限度地提高总交易值（GMV）或点击量，以实现流量效率的最大化。这要求能够精确预测每个商品的GMV转化率或点击率。文章提到的“爆款模型”主要用于电商早期阶段，目标是挖掘并推广那些具有高潜力成为热销商品的产品，通过大量曝光和销售，迅速提升销售额。这个模型强调的是商品的流行度和市场反应，通常会关注统计类特征，如点击率、转化率等，以及时间维度上的变化。随着业务发展，电商进入“追求效率阶段”，这时“转化率模型”显得尤为重要。该模型旨在提高商品的GMV转化率，通过更精准的用户匹配，使流量流向更有可能成交的商品，从而最大化流量的价值。在这个阶段，离散类特征，如商品ID和用户ID，可能会被用来深入理解用户行为模式和商品特性。在进一步提升用户体验和平台品质的“追求品质阶段”，“个性化模型”逐渐成为核心。这种模型不仅考虑用户的购买历史和行为数据，还处理文本类特征，如商品描述和用户评论，以实现更个性化的推荐，减少用户决策的困扰，降低购物过程中的流失率。吴海波强调，模型的迭代必须与业务目标相匹配，才能发挥其最大价值。电商的发展不断推动模型的进化，从最初的爆款模型到更注重用户体验的个性化模型，反映了行业对技术的依赖和对用户需求的深刻理解。随着深度学习和强化学习的引入，电商领域的技术壁垒将进一步提高，为优化用户体验和商业效益带来更大的可能性。在电商的激烈竞争中，运用机器学习进行智能决策已成为不可或缺的手段。通过持续的技术创新和模型迭代，电商平台可以更好地预测用户需求，优化商品排序，最终实现业绩的稳步增长。这不仅是蘑菇街的经验教训，也是整个电商行业发展的缩影。

资源详情

资源推荐

作者 | 吴海波

责编 | 何永灿（heyc@csdn.net）

随着电商竞争的日益加剧，如何准确预估每个商品的GMV转化率，实现流量的最大化，继而达到收益的最大化，这

是所有电商在技术层面都在力求解决的核心问题。

那么，这个核心问题到底是怎么解决的呢？

前蘑菇街（现如今，蘑菇街和美丽说合并后，更名美丽联合集团）电商排序及推荐的技术负责人吴海波近日写了一篇

文章，非常详细地阐述了蘑菇街机器学习从无到有的过程，以及在3年中，技术是如何通过模型迭代，来服务于不同

阶段业务目标----打造爆款、追求效率、提升品质。

比如：追求效率阶段，即提升对商品的GMV转化率，实现流量最大化；而在追求品质阶段，目标则变成了如何减少

损失。

由此，他也提出相应的模型：爆款模型、转化率模型以及个性化模型等。

这是机器学习在电商发展中的从爆款模型再到个性化模型这是业务重心的快速变化，更是电商的适应性进化，

吴海波多年的经验，如果说要用一句话总结，那便是，“模型本身的迭代需配合业务目标才能发挥出最大的价值，因

此选择模型迭代的路线，必须全盘考虑业务的情况。”

这既是蘑菇街的打法，而从中也能窥到整个电商的打法进化论。如今，在新的起点上，电商再次迎来深度学习，强化

学习。关于深度学习和强化学习在具体实践中，是如何服务电商业务，我们在以后的文章再谈。

这场电商抢夺战之间的技术壁垒，真真是越来越高了。

以

下为

吴

海波

的

原

文

，

最

早

发

自

《

程

序

员

》

杂

志

，

本

文

经

授

权

转

自

人

工

智

能

头

条

（

微

信

号

：

AI_Thinker

），

enjoy

！

通

常

机

器

学

习

在

电

商

领

域

有

三

大

应

用

，

推

荐

、

搜

索

、

广

告

。

这

次

我

们

聊聊

三个

领

域

里

都

会

涉

及

到

的

商

品

排

序

问

题

。

从业务角度，一般是在一个召回的商品集合里，通过对商品排序，追求GMV或者点击量最大化。进一步讲，就是基

于一个目标，如何让流量的利用效率最高。很自然的，如果我们可以准确预估每个商品的GMV转化率或者点击率，

就可以最大化利用流量，从而收益最大。

蘑菇街是一个年轻女性垂直电商平台，主要从事服饰鞋包类目，2015年时全年GMV超过了百亿，后与美丽说合并后

公司更名为美丽联合集团。2014年时入职蘑菇街，那时候蘑菇街刚刚开始尝试机器学习，这3年中经历了很多变化，

打造爆款、追求效率、提升品质等等。虽然在过程中经常和业务方互相challenge，但我们的理念——技术服务于业

务始终没有变化过。模型本身的迭代需配合业务目标才能发挥出最大的价值，因此选择模型迭代的路线，必须全盘考

虑业务的情况。

在开始前，先和大家讨论一些方法论。

在

点

击

率

预

估

领

域

，

常

用

的

是

有

监督

的

模

型

，

其

中

样

本

、

特

征

、

模

型

是

三个

绕

不

开

的

问

题

。首先，如何构建样本，涉及模型的目标函数是什么，即要优化什么。原则上，我们希望样本构建越接

近真实场景越好。比如点击率模型常用用户行为日志作为样本，曝光过没有点击的日志是负样本，有点击的是正样

本，去构建样本集，变成一个二分类。在另一个相似的领域——Learning to rank，样本构建方法可以分为三类：

pointwise、pairwise、listwise。

简单来讲，前面提到的构建样本方式属于pointwise范畴，即每一条样本构建时不考虑与其他样本直接的关系。但真

实的场景中，往往需要考虑其他样本的影响，比如去百度搜一个关键字，会出来一系列的结果，用户的决策会受整个

排序结果影响。故pairwise做了一点改进，它的样本都是由pair对组成，比如电商搜索下，商品a和商品b可以构建一

个样本，如果a比b好，样本pair{a，b}是正样本，否则是负样本。当然，这会带来新问题，比如a>b，b>c，c>a，这

个时候怎么办？有兴趣的同学可以参考：

下载后可阅读完整内容，剩余6页未读，立即下载

普通网友

粉丝: 21
资源:
319

电商机器学习实践：从爆款到个性化模型的演进

蘑菇街电商算法演化：从爆款模型到个性化模型（22页）.pdf

DCN模型在电商广告转化率预估中的应用.pdf

DCN模型在电商广告转化率预估中的应用.zip

基于机器学习的电商网站用户行为分析及推荐系统不足之处

如何在实际应用中部署机器学习模型？

机器学习在仿真模型验证中的应用

机器学习在仿真模型确认中的应用

在web中嵌入机器学习模型

蒸馏学习在机器学习中的应用

机器学习在仿真模型可信度外推中的应用

怎么构建web应用以使用机器学习模型

机器学习应用在仿真模型可信度外推中的案例

机理模型和机器学习模型如何结合 具体实施方法

对比着以上四种机器学习模型在舆情分析中应用的效果

你觉得那个机器学习模型更适合应用于网络舆情分析

电商评论情感分析机器学习

python构建一个决策树机器学习模型，转化为pmml模型

谈谈自己对机器学习的理解及自己身边机器学习应用实例

简述什么是机器学习，至少举例两个常见的机器学习应用，并对这些应用所需要用到的机器学习知识进行简单阐述

机器学习的模型分为什么

最新资源

机理模型和机器学习模型如何结合具体实施方法