Embedding技术如何融入传统机器学习框架——以LR为例

版权申诉

27 浏览量更新于2024-08-04 收藏 1.29MB PDF 举报

"这篇文档探讨了如何在不使用深度学习模型的情况下，将Embedding技术融入传统的机器学习框架，特别是逻辑回归(LR)和梯度提升决策树(GBDT)。作者石塔西提出，尽管深度学习模型如DNN在推荐和广告系统中广泛应用，但上线困难的问题使得传统算法仍有其价值。在某些情况下，如后端支持有限或实时性要求高，LR和GBDT可能更为合适。" 文章中提到，Embedding技术在传统机器学习算法中的应用具有实战价值，尤其是在DNN上线困难的场景下。Embedding能够将离散特征转换为连续向量，增强模型的表达能力，但直接使用Embedding可能并不适合传统的LR框架。因为LR模型通常处理离散特征，而Embedding产生的向量是连续的，直接使用可能导致计算复杂度增加。石塔西建议，一种可能的方法是不直接使用Embedding本身，而是将其转化为可被LR接受的形式。例如，可以将每个特征的Embedding向量的平均值或者加权平均值作为新的特征引入到LR模型中。这样，原本的离散特征被转换成了实数值，符合LR的输入要求，同时保留了Embedding的部分信息。此外，还可以考虑使用部分维度的Embedding，或者采用降维方法（如PCA）来减少特征的维度，从而降低计算复杂度。另一个策略是通过组合Embedding，比如将不同特征的Embedding进行拼接或者相加，创建新的组合特征，这些组合特征可以反映原始特征之间的关系，有助于LR模型学习更复杂的模式。在实际应用中，还需要注意特征选择和模型正则化，以防止过拟合。可以使用特征重要性评估来决定哪些组合特征应该保留，哪些可以剔除。同时，正则化技术如L1和L2可以帮助控制模型的复杂度，保持较好的泛化能力。将Embedding融入传统机器学习框架需要创新性地处理特征表示，以保持模型的简洁性和实时性。这需要根据具体业务需求和计算资源来调整策略，找到最佳平衡点。通过这些方法，即使在限制使用复杂模型的环境下，也能充分利用Embedding的优势，提升传统机器学习模型的性能。

怎

样

将

beddi

融

⼊

传

统

机

器

学

习

框架

？

⽂

⽯

塔

⻄

知

乎

本

⽂

已

获

作

者

转载

授

权

，

禁

⽌

⼆

次

转载

本

身

是

⼀个

经

典

的

CTR

模

型

，

⼴

泛

应

⽤

于

推

荐

⼴

告

系统

。

输

⼊

的

特

征

⼤多

数

是

离

散

型

组

合

型

。

那

么

对

于

Embedding

技

术

，

如

何

在

不

使

⽤

深

度

学

习

模

型

的

情

况

下（

假

设

就

是

不

能

⽤

DNN

），

融

⼊到

框架

中

呢

？

让

我

们

来

看看

清

华

⼤

学

的

博

⼠

⽯

塔

⻄

⼤

佬

是

如

何

解

答

的

。

问题

实

战意

义

其

实

这

个

问题

可

以

再

扩

展

⼀下，

即

，

如

何

在

传

统

机

器

学

习

算

法

（

LR/GBDT

）

中使

⽤

Embedding

信

息

。

这

个

问题

并

⾮

空⽳

来

⻛

，

⽽

是有

⼀

定

的

实

战

价

值

。

⽬

前

DNN

热

度

不

减

，

基

本

上

成

为

推

荐

、

搜

索系统

的

标

配

算

法

。

传

统

机

器

学

习

算

法

，

如

、

GBDT

，

纷纷

被

打

⼊冷

宫

，

得

不

到关

注

。

⾄

于为什么

DNN

能

够

成

功

上

位

，

独

占各

位

打

⼯

⼈

的

欢

⼼

，

请

参

考

我

的

⽂

章

《

⽆

中

⽣

有

：

论

推

荐

算

法

中

的

Embedding

思

想

》

[1]

。

但

是

，

DNN

有

⼀个

致

命

缺

点

，

就

是

上

线

困

难

。

训

练

的

时

候

，

各

位

调

参

侠

，

把

各

种

酷

炫

的

结

构

，

什么

attention, transformer, capsule

，

能

加

上

的

都

给

它

加

上，

看着

离

线

指

标

⼀

路

上

涨

，

⼼

⾥

和

脸

上

都

乐

开

了

花

，

却

全

然

⽆

视

旁

边

的

后

端

⼯

程

师

恨得

咬

紧

了

⽛

根

。

模

型

越

复

杂

，

离

线

和

线

上

指

标未

必

就

更

好

，

但

是

线

上

的

时

间

开

销

肯

定

会

增

加

，

轻

则

影

响

算

法

与

后

端

的

同

事

关

系

（

打

⼯

⼈何

苦

为

难

打

⼯

⼈

），

重

则

你

那

离

线

指

标

完

美

的

模

型

压

根

没

有

上

线

的

机

会

。

虽

说

，

⽬

前

已

经

有

TF Serving

这

样

的

线

上

serving

框架

，

但

是

它

也

不

是

开

箱

即

⽤

的

，

也

需

要

⼀

系

列

的

性

能

调

优

，

才

能

满

⾜

线

上

的

实

时

性

要

求

。

所

以

，

如

果

你

身

处

⼀个

⼩

团

队

，

后

端

⼯

程

⼈

员

的

技

术

能

⼒

不

强

，

在

线

DNN

就

会

成

为

⼀个

难题

，

这

个

时

候

，

传

统

的

、

GBDT

就

凸

显

出

优

势

。

如

果

全

部

使

⽤

类

特

征

（

实

数

特

征

也

桶

化

成

类

特

征

），

那

么

在

线

上

就

简

化

成

“

查

表

取

权

重

，

再

累

加

“

，

连

乘

法

都

省

了

，

实

时

性

⾃

然

有

保

证

。

但

是

，

如

果

你

想

⻥

与

熊

掌

兼

得

，

既

不

得

不

使

⽤

简

单

的

传

统

机

器

学

习

算

法

，

⼜

想

利

⽤

Embedding

带

来

扩

展

能

⼒

上

的

提

升

，

你

该

怎

么

办

？

唉

，

费

了

半

天

⼝

⾆

，

只

是

解

了

题

⽽

已

，

⽬的

是

为了

说

明

这

⼀

问题

的

实

战意

义

，

引

起

⼤

家对

这

⼀

问题

的

重

视

。

不

推

荐

直

接

使

⽤

Embedding

本

身

⽯

塔

⻄

2020-12-19

22:00

原

创

夕

⼩

瑶

的

卖

萌

屋

下载后可阅读完整内容，剩余3页未读，立即下载

普通网友

粉丝: 1264
资源:
5619

Embedding技术如何融入传统机器学习框架——以LR为例

怎样将Embedding融入传统机器学习框架？.rar

谈论AI 时被经常提及的“嵌入（embedding）”和“向量（Vector）”到底是个啥？.pdf

一类动态模糊机器学习算法研究.pdf

RotatE：Knowledge Graph Embedding by Relational Rotation in Complex Space.pdf

藏经阁-信息检索与机器学习的华尔兹.pdf

6-2+浅谈点击率预测模型中Embedding层的学习和训练.pdf

Embedding Logical Queries on Knowledge Graphs.pdf

李宏毅机器学习笔记.pdf

word_embedding.model.wv.vectors.npy

embedding理解.pdf

最新资源