关系数据表示学习

113 浏览量更新于2024-02-06 收藏 7.36MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

关系数据卢多维奇·多斯桑托斯引用此版本：卢多维奇·多斯桑托斯。关系数据的表示学习机器学习[cs.LG]。皮埃尔和玛丽·居里大学-巴黎第六大学，2017年。英语。NNT：2017PA066480。电话：01803188HAL ID：电话：01803188https://theses.hal.science/tel-01803188提交日期：2018年HAL是一个多学科的开放存取档案馆，用于存放和传播科学研究论文，无论它们是否被公开。论文可以来自法国或国外的教学和研究机构，也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaireUNIVERSITY PIERRE和 MARIE CURIE计算机科学、电信和电子学博士学院（巴黎）巴黎6号计算机科学实验室D八角形T HESIS关系数据表示学习作者：Ludovic DOS SAntos主管：Patrick GALLINARI联合主管：本杰明·P·伊沃瓦斯基为满足计算机科学博士学位的要求而提交的论文评审团成员：先生蒂埃里·A·退休记者先生尤尼斯·B·恩纳尼先生Patrick G. ALLINARI主管先生Rémi GIlleron记者女士Marie-Jeanne LESOT审查员先生Benjamin PIWOWARSKI联合主管2017年 12月13日星期三iii摘要社交和传感器网络的日益使用产生了大量可以表示为复杂图形的数据。有许多任务，从信息分析到预测和检索，人们可以想象哪些数据在图节点之间的关系应该是信息。在本文中，我们为三种不同的任务提出了不同的模型• 图节点分类• 关系时间序列预测• 协作筛选所有提出的模型都在其确定性或高斯变体中使用表示学习框架。首先，我们提出了两种异构图标记任务的算法，一种使用确定性表示，另一种使用高斯表示。与其他最先进的模型相反，我们的解决方案能够在同时学习表示和分类器时学习边权重。第二，我们提出了一种关系时间序列预测算法，其中观测不仅在每个序列内相关，而且在不同序列之间相关。我们在这篇文章中使用高斯表示这是一个机会，看看如何使用高斯表示，而不是确定性的是有利可图的。最后，我们将高斯表示学习方法应用于协作过滤任务。这是一个初步的工作，看看是否高斯表示的性质发现在前两个任务也检查了排名一。这项工作的目标是将该方法推广到更多的关系数据，而不仅仅是用户和项目之间的两部分图。v内容。图1列表表3列表1导言51.1背景51.1.1任务61.1.2图形类型61.1.3大纲71.2论文8中研究的任务1.2.1分类任务81.2.2预测任务81.2.3排名任务91.3学习表征91.4捐款101.4.1学习异构图节点分类的确定性表示（第4章）1.4.2学习高斯表示11学习异构图节点分类的高斯表示（第5章）学习关系时间序列的高斯表示法（第6章）学习排名的高斯表示法（第7章）1.5论文组织122关系数据的学习表示2.1导言152.2图形中的学习表示172.2.1归纳和转导算法17诱导17转导182.2.2监督、无监督和半监督学习无监督学习18监督学习19半监督学习19我们的贡献192.3学习决定论表征192.3.1无监督模型20从上下文中学习20六3.2监督和半监督模型。 . . . . . . . . . . . . . . . ...22知识库中的学习节点和关系表示 22分类中从未标记到标记的数据 . . . . . . . . . . . ...242.3.3表征学习 . . . . . . . . . . . ...252.4捕捉表示中的。 . . . . . . . . . . . . . . . . . . ...26贝叶斯方法。 . . . . . . . . . . . . . . . . . . . . . . . . . . ...26直接方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...272.5结论。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...29我学习确定性表示及其在分类中的应用333最新技术水平：图节点分类373.1引言。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...373.2图节点分类。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...383.2.1用于图节点分类的简单换能器模型。 . . . . . ...393.2.2其他图形节点分类工程。 . . . . . . . . . . . . . . . . ...393.3结论。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...414用于分类的学习确定性表示434.1引言。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...43图节点分类的学习表示。 . . . . . . . . . . . ...454.2.1模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...45损失函数。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...45分类。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...46转导图模型。 . . . . . . . . . . . . . . . . . . . . . . . . ...464.2.2先验参数和学习算法。 . . . . . . . . . . . . . . ...47优先参数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...47学习的关系特定参数 . . . . . . . . . . . . . . . . . . ...474.2.3算法。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...504.2.4实验。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...50数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...50构建最后的FM数据集。 . . . . . . . . . . . . . . . . . . ...53异源节点相互影响的证据 . . . . . . . ...53与其他型号的比较 . . . . . . . . . . . . . . . . . . . . . ...58评估措施和方案。 . . . . . . . . . . . . . . . . . . . ...59结果。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...61关系权重的重要性 . . . . . . . . . . . . . . . . . ...65最新FM2数据集上的标签相关性。 . . . . . . . . . . . . . . . ...674.3结论。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...68二学习高斯表示及其应用715用于分类的学习高斯表示755.1引言。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...755.2高斯嵌入图节点分类 . . . . . . . . . . . . ...76vii5.2.176型损失函数77分类77图形嵌入79先前参数和学习的关系特定参数算法805.2.2实验80数据集80结果81定性讨论835.3结论846学习关系时间序列预测的6.1导言876.1.1关系时间系列876.1.2贡献886.2相关工作896.3高斯嵌入关系时间序列预测916.3.191型符号和任务形式描述916.3.2非正式描述91模型定义92最小化KL偏差对预测值的95推理和时间复杂性96变体966.3.3实验97数据集9797年基线实验方案98结果986.4结论1017学习协作过滤1037.1导言1037.1.1推荐系统和不确定性1037.1.2捐款1057.2用于协作过滤的学习高斯嵌入1057.2.1型号105高斯嵌入排名模型106损失函数108订购项目1097.2.2实验109分析111六7.3结论117第三章结论1198结论和观点1218.1结论1218.1.1贡献121图节点分类121关系时间序列预测122协作筛选1228.1.2学习超参数1228.1.3从确定性到高斯表示1228.2前景1238.2.1分类任务1238.2.2预测任务1238.2.3排名任务1248.2.4学习高斯知识库嵌入124参考文献125八||||图列表1.1具有作者、评论、照片、视频等的异构多标签图示例。通过不同类型的关系联系在一起，如朋友-船舶、同事、视频相似性等。......................................................................................... 71.2显示不同章节之间依赖关系的类似树的结构论文手稿的作者。........................................................................................................... 132.1关系数据的表示学习图，其中节点从初始图（左）投影到学习分类器的公共潜在空间（右）。................................................................................................................... 172.2低DKL（ZjZi）..................................................................................................................28的示例2.3具有对角方差的高斯表示法al.， 2015年）。每个单词的第一个字母表示其位置。.............................................. 292.4从（Bojchevski等人，2017年）。颜色表示类标签。................................................ 303.1代表LastFM网络的用户、曲目、专辑和艺术家不同的关系用不同类型的线来表示。........................................................................... 384.1图中显示了LastFM2数据集的两种节点类型的标签之间的相互依赖性。每个图显示P（Yt 1）|Xt2）对于特定变量对（Yt1，Xt2）为清楚起见，对值Xt2和Yt1进行了重新排序（见文本）。对应于变量Xt2的x轴位于每个变量的左下方图，y轴对应于Yt1 它在右下角。................................................................................... 554.2说明DBLP语料库中标签之间相互依赖性的图灰色正方形表示通信方之间没有关系节点类型564.3说明Flickr语料库中标签之间相互依赖性的图564.4说明LastFM2语料库中标签之间相互依赖性的图574.5条件p r概率P（Yt1）累积和平均值的图|对于LastFM2数据集上的所有关系类型。P（Yt1Xt2）在x轴上按递减顺序排列。 x = 40%表示已考虑40%的条件概率值，并且相应的累积值为在y轴上绘制。................................................................................................................. 584.6条件概率P（Yt1Xt2）累积和平均值的图（x轴上的累积百分比），适用于所有数据集上的所有关系类型594.7在LastFM2的所有关系和参与用户的培训步骤中，价值观的演变。在收敛时，w用户→用户= 0。22，w用户→轨道= 0。28，w用户→相册=0. 25，w用户→艺术家=0。25........................................................................................ 67我L±2图列表4.8LastFM2语料库：具有相同字符串标签的30个分类器之间的余弦图。例如，第15行对应于pop_artist，第15列对应于pop_track照亮广场，更大的产品规模............................................................................................................... 684.9LastFM2语料库：对于两种不同的节点类型，具有相同字符串式标签（例如"pop"）的分类器之间的余弦图。................................................................................. 695.1 LastFM数据集上HCGE（ΔEV，S）模型的定性结果，其中50%的数据集用于列车。在图5.1b中，我们计算了高斯内核密度以显示图中的高密度区域。........................................................................... 856.1将关系时间序列表示为图形，其中节点对应于序列，边对应于两个序列之间的先前关系。在此本章中考虑的任务是预测。........................................................................................... 886.2高斯嵌入Z（t）、动态函数h及其解码函数f已学习。我们使用h和Z（t）计算Z（t+1）和Z（t+2）。然后我是我我们使用f分别从Z（t+1）和Z（t+2）计算X（t+1）和X（t +2）。...92我是我6.3比较基线之间四个数据集T+1时的RMSG与我们提出的预测任务模型（RDG）。RDGk，l对应于有损耗的变量（Δ Dek，Δ DY）。...........................................................996.4比较基线和我们之间GL-T上T+1至T+5的RMS预测任务的建议模型（RDG）...................................................................................... 996.5使用RDG2，2模型对GFT（数据集的两个不同时间序列）的预测显示了其置信范围：E（f（Z（t）var（f（Z（t）。预测在25+n处对应于f（hn（Z（25）1007.1用户（顶部）和项目（底部）学习了MovieLens中每个用户50个项目的培训集的第一分量表示图（σ数据集和表示维数为50。............................................................................................. 1127.2训练集的用户学习组件表示图子集（σ·k vs µ·k，具有不同的k），每个用户有50个MovieLens数据集项目，表示维数为50。..................................................................1137.3来自MovieLens数据集的每个用户有50个项目且表示维数为50的训练集的项目学习分量表示图的子集（σ · k vs µ · k，不同k）。......................................................... 1147.4MovieLens数据集上不同潜在空间维度的用户方差（σ · k）的小提琴（密度）图。使用了三个训练集大小设置（主干水平）：10（顶部）、20（中部）和50（底部）................................................................................................................................. 1157.5MovieLens数据集上不同潜在空间维度的项目方差（σ · k）的小提琴（密度）图。使用了三个训练集大小设置（主干水平）：10（顶部）、20（中部）和50（底部）................................................................................................................................. 1163|||×表列表4.1型号额定值454.2数据集的统计数据524.3最后一个FM2语料库的条件熵H（Y X），X和Y在最后一个FM2图中是Neigh-born。较低的值意味着它们之间的依赖性较高两个变量544.4DBLP语料库....................................................................................................................55的条件熵H（Y X）4.5FlickR语料库的条件熵H（Y X）.................................................................................564.6Model60的超参数4.7LahNet模型和DBLP62基线的P@1结果4.8Flickr62上LaHNet模型和基线的P@k结果4.9LastFM 163上LaHNet模型和基线的P@k结果4.10 LastFM 263上LaHNet模型和基线的P@k结果4.11 LahNet模型和IMDB64基线的P@k结果4.12 LaHNet和LHNet之间P@k性能演变的比较增加培训+验证量（TSP）时的最佳基线......................................................................644.13 学习Flickr的关系特定权重wr的效果。性能表示为微观和宏观精度，如所示，独立-视频关系的性能是微观精度-进一步说明见文本。............................................654.14 学习LastFM1的关系特定权重wr的效果性能表示为所示的微观和宏观精度，个人关系是微观的--进一步的解释见正文.....................................................................664.15 学习LastFM2的关系特定权重wr的效果性能表示为所示的微观和宏观精度，个人关系是微观的--进一步的解释见正文.....................................................................665.1HCGE模型和DBLP81基线的P@1结果5.2基于Flickr82的HCGE模型和基线的P@k结果5.3使用LastFM83的HCGE模型和基线的P@k结果6.1T+ 1时四个数据集的RMS。............................................................................................. 1007.1按截断级别划分的统计数据集（列车上每个用户的10、20或50个评级设置）。......................................................................................................................... 1097.2协作排名结果。 nDCG值（ 100)在主列中显示不同的截断级别，根据培训评级的数量进行划分。............................................................................................................. 1115第一章简介内容。1.1背景。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ...51.1.1任务。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ...61.1.2图形的类型。 . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ...61.1.3大纲。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ...71.2论文期间研究的任务 . . . . . . . . . . . . . . . . . . . . . . ... ...81.2.1分类任务。 . . . . . . . . . . . . . . . . . . . . . . . ... ...81.2预测任务。 . . . . . . . . . . . . . . . . . . . . . . . . ... ...81.2.2排名任务。 . . . . . . . . . . . . . . . . . . . . . . . . . . ... ...91.3学习表征。 . . . . . . . . . . . . . . . . . . . . . . . . . . ...91.4捐款101.4.1学习异构图节点分类的确定性表示（第4章）1.4.2学习高斯表示111.5论文组织........................................................................................................................121.1上下文自21世纪初以来，在线服务得到了很大的发展和使用，如在线社交网络（Facebook、LinkedIn...），电子商务（亚马逊、eBay等），视频或音乐点播（Netflix、YouTube、LastFM等），和开放数据网站（城市交通、气象、停车使用等）。大量用户对这些服务的使用会产生大量的数据，如评级、喜欢和流量数据。这些数据告诉我们人类行为的许多方面，如用户的习惯、品味和友谊。大量收集的用户相关数据可以表示为各种类型的实体（例如用户、照片、项目、街道）彼此交互的图形。由于这些相互作用可用作补充信息来源，因此不应单独考虑这些实体。他们经常通过各种各样的关系联系在一起，如友谊、评级、地理上的接近。在下面，我们将讨论一个图表或关系数据，以参考这种类型的链接数据。这样的图表是一个重要的知识来源，可能与帮助推断丢失的环信息有关。这类数据通常非常广泛，从几千个6第一章。简介连接到数十亿个节点。这就是为什么使用机器学习技术来解决与此数据相关的各种可能任务至关重要。1.1.1任务以下是与图形和关系数据相关的一般任务的一些具体示例节点图分类：在LastFM1上给定一个新曲目，根据谁上传了它和谁听了它来推断曲目的类别（例如音乐风格）;图分类：给定一张表示蛋白质的图，根据分子的排列方式预测其类别和性质。• 链接预测：给定一个有偏图，推断其缺失的边信息传播：在像Twitter这样的社交网络中，预测信息如何通过图的节点传播。聚类：在社交网络中，根据用户的兴趣（体育、科学、政治......）检测用户社区;回归：了解城市中某些街道的交通量，估计特定未观察街道（或未来）的交通量学习排名：根据过去的评级和元信息对Netflix用户的电影进行排名异常检测：在工业过程生产中提供不同传感器的网络，预测产品损坏的风险何时很高。1.1.2图表类型在本文中，我们将重点放在节点特定的任务上，并区分两种可以进行推理和学习的图：属性图是每个节点都与原始图像、产品指标或任何其他特征等属性相关联的图。未分配的图形是没有与节点关联的特征的图形。仅提供节点之间的边。在图中，节点可以具有不同的类型，这些类型对应于现实世界中的不同类别的实体（例如，用户、歌曲等）。根据节点的不同类型和节点之间的关系，存在不同类型的图：同质或异质，单相关或多相关。齐次图对应于只有一种类型的节点和它们之间的一种类型的关系的图。异构图对应于存在不同类型的节点以及不同类型的节点之间存在不同类型的关系的图。LastFM是一个音乐社交网络。···········1.1. 上下文7图1.1：具有作者、评论、照片、视频等的异构多标签图的示例。通过不同类型的关系（如友谊、同事、视频相似性等）链接在一起。单关系图对应于最多有一个关系的图-中间有两个给定节点。多关系图是指两个节点可以通过多于一个关系链接的图。在我们的工作中，我们没有特别关注最新类型的图，尽管我们的模型能够处理多关系图，但我们的数据集没有一个是多关系的。图1.1给出了一个与节点关联的多个标签的异构图的例子在这篇论文中，我们专注于非赋值图，以及如何仅基于图的结构来学习潜在机器学习技术主要是在实体是独立恒等式分布（i.i.d.）的假设下开发的，这显然不是我们的情况，因为这取决于其他人。这些技术无法考虑到相互依赖性，因此确实需要开发针对图形数据的特定技术。这就是本文的主要目的。1.1.3大纲本章的其余部分组织如下：在1.2节中，我们描述了论文中研究的三个不同任务;在1.3节中，我们非正式地介绍了表征学习，这是我们开发的所有模型中使用的框架。··8第一章。简介在第1.4节中，我们概述了我们的四项贡献。最后，第1.5节给出了论文章节之间的依赖关系。1.2论文期间研究的任务在各种可能的任务中，我们专注于其中的三个，即分类、选角前和排名。在本节中，我们将简要定义它们。这些任务在相应的章节中有详细说明。大部分的论文工作集中在分类任务（见1.2.1节），首先使用确定性表示，然后使用高斯表示（见1.3节）。给定高斯表示的正结果，我们将高斯表示学习应用于其他任务，即预测（见1.2.2节）和排名（见1.2.3节）。1.2.1分类任务分类任务包括根据一组训练的观察实例确定新实例需要的类别。垃圾邮件过滤是分类的一个典型示例，我们希望区分垃圾邮件（广告商、黑客等）从别人那里。在本文中，我们将更具体地处理图节点多标签分类任务。与经典分类的不同之处在于，实例是通过关系图构建的，并且我们使用半监督换能器框架。例如，在LastFM（我们贡献中使用的数据集之一）的情况下，不同类型的节点（用户、曲目、专辑和艺术家）通过七种不同类型的关系进行交互，如友谊、最常收听的曲目、作者身份。例如，一个曲目可能有流行、摇滚和现场音乐这三个标签，但某些节点（用户、曲目、专辑或艺术家）可能缺少标签。该任务包括使用已知标签和不同类型节点之间存在的关系来推断这些节点的标签。在本文的上下文中，我们的目标是利用表示学习技术来解决异构数据的图节点多标签分类任务，即节点和边可以是不同类型的。此任务称为异构图节点分类。请注意，不同的标签集可以与每个节点类型相关联1.2.2预测任务预测任务包括根据过去预测多变量时间序列的未来或缺失值。一个实际的例子是库存优化：知道一家公司在过去几周销售了多少商品，我们就想预测公司在未来几周将销售多少商品，以生产出正确的数量。在本文中，我们将时间序列视为一种特殊类型的具有时间关系的图，从而扩展了为分类而开发的方法。在时间结构的基础上，提出的方法利用了不同时间序列之间的关系。例如，一种产品可能是另一种产品（如打印机）的消耗品（如墨水）;这种关系可能会影响预测。另一个例子是法国里昂市50条最繁忙道路的交通数据汇总于20分钟-窗口运行时间为15天。系列之间的关系基于地理位置1.3. 学习表征9在一个位置，由于在时间T有交通，道路的接近度可能在时间T+ 1对相邻道路产生影响这里的任务包括，知道从时间T0到时间T的流量，预测时间T+n的流量。在本文中，为了模拟这样一个序列的联合关系和时间动力学，我们学习了潜在空间中的高斯分布。解码器然后将潜在表示映射到观察结果。这使我们能够对观测中固有的不确定性进行建模，并对预测有信心地一起预测未观测值。1.2.3排名任务最后，排名任务，也被称为学习排名，包括根据特定的查询对一组实例进行排序。有各种各样的应用程序和各种各样的可能研究的数据，如单词，文档，项目等。文档检索或推荐是众所周知的排名任务的例子。它包括对给定查询的文档或项目的集合进行排序。在本文中，我们讨论了用于推荐（协作过滤）的排名任务。在这里，我们希望根据所有用户以前评级的项目为特定用户订购项目列表。协作过滤可以嵌入到涉及关系数据的问题中。例如，在音乐推荐任务中，人们可以想象具有LastFM数据集的曲目的用户评级。利用图形结构来学习在推荐上下文中对项目进行排名的表示是一项具有挑战性的任务。在本文中，我们朝着这个方向迈出了第一步。我们在协作过滤的背景下学习高斯函数。该模型基于这样一种方法，即我们不是对可能性的概率分布建模，而是直接将用户和项目建模为高斯表示。这允许我们基于用户和项目表示的高斯模型来计算和最大化可能性分布这种高斯表示法使我们能够处理由于缺乏信息或信息冲突而产生的固有不确定性。1.3学习表示本文探讨了解决1.2节中提出的各种任务的表征学习技术。它包括学习图的每个实体或节点（例如图像、单词或用户）在向量空间Rd中的表示。学习这样的表示使我们能够使用比初始表示更紧凑的表示，发现新的关系或相似性，简化推理，比较公共潜在空间中的不同类型的数据，或者更重要的是，使用可以表示不同类型的实体的同质表示空间。例如，对于像图像分类这样的经典（非图形）分类任务，代替处理显示大量噪声和不相关信息的像素向量，表征学习技术将该像素向量转换成仅编码语义信息的较小向量。对于使用向量而不是单词的自然例如，要找到一些同义词，人们可以想象学习表示，如单词同样的意义在表象空间中是紧密相连的。10第一章。简介表征学习框架最近被应用于不同类型的领域，在2010年期间在不同领域产生了一些强烈的影响和突破性的结果（2013年）：语音识别（Dahl等人，2010年; Deng等人，2010年; Dahl等人，2012年; Hinton等人，2012年; Mohamed等人，2012年; Seide等人，（2011年）;• 信号处理（Boulanger-Lewandowski等人，2011年; Hamel等人，（2011年）;• 对象识别（Ciregan等人，2012年; Rifai等人，（2011年）;自然语言处理（Collobert等人，2011年; Weston等人，2010年; Srivastava等人，2012年; Socher等人，2011年; Glorot等人，2011年; Bordes等人，2012年; Mikolov等人，2013年）;迁移学习（Bengio，2012; Chen等人，2012 a; Krizhevsky等人，2012年; Dauphin等人，2012年）。在关系数据的情况下，我们假设每个关系对应于两个链接节点的学习表示之间的地理虽然可以使用许多几何约束，但我们单独利用了其中最常见的一个约束，这是基于相似实体在表示空间中应该一起闭合的假设。然而，将节点简单地表示为点有一个关键的局限性：我们无法获得有关该表示的不确定性的信息在处理缺失或冲突的信息时，不确定性建模非常有用。当在复杂图中描述节点时，不确定性是固有的：想象一个用户的不同信息源发生冲突，例如指向不同的社区。我们想把这种不确定性编码到它的嵌入中。这个问题的一个解决方案是将节点表示为高斯分布：每个节点成为一个完整的分布（而不仅仅是一个单点），以捕获其表示的不确定性。因此，代替学习确定性表示，我们可以学习具有相同类型的约束但适应于随机变量的密度。这里我们希望类似的实体具有类似的分布。我们现在详细介绍这篇论文的主要贡献1.4贡献本文将表征学习框架应用于三个不同的任务。对于图节点分类任务，我们学习了图的每个节点的确定性表示，以及分类器（第4章）。我们将这个模型扩展到使用高斯表示来处理不确定性和冲突信息（第5章）。由于我们使用新的高斯表示学习框架工作得到了有希望的结果，我们探索了它在其他任务中的用途，以了解模型可以学习什么样的表示，以及这样的表示可以具有什么样的定性属性。特别是，我们将高斯表示框架应用于预测（第6章）和排名（第7章）。···1.4. 捐款111.4.1学习异构图节点分类的确定性表示（第4章）在本文中，我们使用表示学习框架来完成异构网络中的节点分类任务。节点可以是不同的类型，每个类型具有其自己的一组标签，并且节点之间的关系也可以是不同的类型。一个典型的例子是由社交网络提供的，其中节点类型是例如用户、内容、组等，并且关系可以是友谊、喜欢、作者等。在这种异构网络上学习和执行推理是最近的任务，需要新的模型和算法。请注意，在开展这项工作时，这项任务基本上没有得到探讨。我们提出了一种转导分类方法，学习将不同类型的节点投射到一个共同的潜在空间中。学习这种嵌入以反映问题的不同特征，例如具有不同类型的节点的标签与图拓扑之间的相关性。不同类型的节点之间的这些相互依赖性在几个分类问题中起着重要的作用，并且当前的方法都不能正确地处理它们。在本文中，所提出的模型还结合节点表示和分类器，学习了处理这些相互依赖性的特定关系权重。该应用程序的重点是社交图，但算法是通用的，可以很好地用于其他领域。该模型在来自不同社会数据实例的五个代表性数据集上进行了评估，与竞争方法相比效果更好。实验结果表明，所提出的模型能够学习不同类型节点的标签之间的相关性，显著改善了类标签推理。1.4.2学习高斯表示学习异构图节点分类的高斯表示（第5章）

下载后可阅读完整内容，剩余1页未读，立即下载