推导有效时间的知识图谱的研究

19 浏览量更新于2023-10-16 收藏 12.76MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

17710在知识图谱中推导有效时间0Julien Leblay �0人工智能研究中心AIST东京滨海东京，日本firstname.lastname@aist.go.jp0Melisachew WudageChekol数据和Web科学小组曼海姆大学曼海姆，德国mel@informatik.uni-mannheim.de0摘要0知识图谱（KGs）是在Web上表示知识的一种流行方式，通常以节点/边标记的有向图形式存在。我们考虑时间KGs，其中边缘进一步用时间间隔进行注释，反映实体之间的关系何时发生。在本文中，我们专注于预测未注释边缘的时间有效性的任务。我们将问题作为关系嵌入的变体引入。我们改编现有方法，并探索在学习过程中选择示例和整合边缘信息的重要性。我们详细介绍了我们的实验评估。0CCS概念0• 计算方法学 → 时间推理；监督学习；0关键词0时间知识图谱，分解机0ACM参考格式：Julien Leblay和Melisachew WudageChekol。2018年。在WWW '18Companion：2018年Web会议伴侣中推导有效时间的知识图谱。2018年4月23日至27日，法国里昂。ACM，美国纽约，6页。https://doi.org/10.1145/3184558.319163901 引言0知识图谱（KGs）包括一类知识表示模型，其中节点对应实体，有向带标签的边表示它们之间的关系。一些著名的KGs示例包括Google的Knowledge Vault [5]，NELL [4]，YAGO [6]和DBpedia[1]。无论数据是由用户还是计算机程序生成和维护，错误和遗漏很容易扩散，数据很快就会过时。更糟糕的是，一些用于数据发布的最流行格式，包括RDF，JSON或CSV，都没有提供内置机制来轻松捕捉和保留随时间变化的信息。例如，考虑从DBpedia（http://dbpedia.org/page/Grover_Cleveland）数据集中提取的关于美国第22和第24任总统Grover Cleveland的以下事实。0� Leblay博士的工作得到了KAKENHI资助，资助号码为17K12786。0本文发表在知识共享署名4.0国际许可证（CC BY4.0）下。作者保留在个人和公司网站上传播作品的权利，并附上适当的归属。WWW '18Companion，2018年4月23日至27日，法国里昂，© 2018IW3C2（国际万维网会议委员会），根据知识共享CC BY 4.0许可证发布。ACM ISBN978-1-4503-5640-4/18/04。https://doi.org/10.1145/3184558.31916390（GCleveland，birthPlace，Caldwell），（GCleveland，office，POTUS），（GCleveland，office，NewYork_Governor）在这个例子中，缺乏时间信息有几个问题。这些事实中没有一个是独立错误的，但格罗弗∙克利夫兰不可能同时担任总统和州长。此外，由于格罗弗∙克利夫兰曾两次担任总统，期间不连续，因此缺少这些信息。因此，明显的时间元数据将消除一些歧义，但并非所有事实通常都需要此类元数据。例如，他的出生地不会随时间变化。许多KGs不包含事实的有效期，即被认为是持有事实的期间。值得注意的例外包括Wikidata[20]和YAGO，其中一些事实具有时间信息。我们的目标是在缺少此类信息的知识图谱上学习时间元数据。对于上述示例，我们希望推导出以下形式的注释：（GCleveland，office，POTUS）：[1885-1889;1893-1897]（GCleveland，office，NewYork_Governor）：[1883-1885]请注意，格罗弗∙克利夫兰在两个不同的、不连续的任期内担任总统。在下一节中，我们提供一些形式背景并回顾相关工作。在第3节中，我们首先尝试采用关系嵌入模型的技术，并研究这些方法的局限性。然后，我们继续展示分解机在我们的时间范围预测任务中特别适用，可以考虑有价值的边缘信息。在第4节中，我们报告了早期的实验结果。02 前提条件0在接下来的内容中，我们正式介绍时间知识图谱，以及本文所涉及的问题。我们提出了关系嵌入方法和因子分解机的可能扩展。02.1 时间知识图谱0我们考虑的是形式为G = (E,R)的知识图谱，其中E是一组称为实体的标记节点，R是一组称为关系的标记边。或者，我们可以将G称为形式为(subject, predicate,object)的三元组集合，其中subject和object是节点标签，predicate是边标签。标签作为主体和谓词的唯一标识符，也可以作为对象的标识符或文字值。因此，两个节点s和o之间存在边p表示事实(s, p,o)成立。实际上，知识在时间上并非静态的，因此我们希望捕捉给定事实随时间变化的情况。因此，我们假设一组离散的时间点T，并在边上使用附加的标签方案。0研讨会：第八届时间Web分析研讨会WWW 2018，2018年4月23-27日，法国里昂score(s, p, o) =s + po ℓ1/2(1)score(s,p,o) = s⊤Wpo.(2)17720该标签方案使用T上的一组时间间隔，表示事实被认为真实的时间段。这产生了一个时间知识图谱。02.2 问题陈述0我们的目标是学习知识图谱中事实与一个或多个时间点的关联。这使我们能够解决以下任务：0时间预测：给定形式为(s, p, o,?)的查询，预测事实被认为有效/真实的时间点。时间相关的查询回答：给定一个时间点和一个具有缺失主体、谓词或对象的事实，预测最可能的标签。02.3 相关工作0我们从三个不同的角度介绍相关工作：(i)知识图谱事实的时间范围确定，(ii)用于链接预测的关系嵌入，以及(iii)用于三元组分类的因子分解机。02.3.1知识图谱事实的时间范围确定。最近，推导知识图谱事实的时间范围的研究日益增多。其中最新的是Know-Evolve[19]。Know-Evolve中的时间知识图谱是一组具有时间戳关系的事实。他们使用双线性模型(RESCAL)来嵌入实体和时间戳关系，并采用深度递归神经网络来学习非线性演化的实体。学习阶段采用了点过程，即在时间t的状态基于时间t-1的状态来估计事实在时间t是否成立。然而，他们没有像我们在这项工作中那样利用附加信息。另一个密切相关的工作是姜等人的时间感知知识图谱嵌入模型[7]。他们专注于在给定事实应该有效的时间点上预测实体或关系。Know-Evolve和时间感知知识图谱完成方法都使用了下面讨论的关系嵌入模型。此外，在[18]中，作者使用张量分解为知识图谱事实分配有效范围。然而，正如论文中所报道的，他们的模型表现不够好。然而，通过像我们在这里做的那样包含附加信息，这一点可以得到改善。相反，Rula等人[14]使用句法规则从网页中提取时间信息。这个过程有三个阶段，其中事实的候选时间间隔被匹配、选择，然后根据时间一致性规则合并。YAGO[6]是另一个早期的例子，其中使用语言提取规则提取时间和空间范围，然后进行冲突解决后处理。在[21]中，作者将时间范围问题形式化为状态变化检测问题。为此，他们使用相关的上下文信息丰富实体的时间轮廓（例如，对于实体BarackObama，相关的单词包括“elect”、“senator”等）。然后，他们学习反映上下文中变化模式的向量。例如，在“成为总统”之后，美国总统通常会看到他们之前的工作职称状态（如“参议员”或“州长”）的提及减少，而“总统”的提及增加。[15]开发的另一个时间范围系统依赖于由语言模型组成的从模式自动派生的模式。0维基百科的句子包含页面的主要实体和从相应的信息框中提取的时间槽填充器。Talukdar等人[17]使用事实提及的频率计数来定义事实的时间概况（基本上是历史文档语料库中事实随时间发生的时间序列），并分析这些事实的提及如何随时间的推移而上升和下降。他们使用三阶段过程识别输入事实的时间范围。然而，该方法相当脆弱，不会自动适应新的关系，并且在过程中需要人工专家的参与。Bader等人[2]在Enron电子邮件数据集上使用矩阵分解来估计丑闻的利益相关者之间的关系随时间的变化。与我们的设置不同，这些关系没有标记。02.3.2关系嵌入方法。我们的问题更广泛地与关系嵌入模型相关，这是一种在低维向量空间中进行关系学习的范例，广泛用于链接预测和事实分类等任务。这样的嵌入可以被视为图嵌入的一种特殊情况，图嵌入是一个非常活跃的研究课题，我们在这里为了简洁起见省略了。我们可以根据以下几个方面广泛将模型分为三类：（i）平移距离，（ii）张量分解（双线性模型），以及最近的（iii）神经网络。在平移模型中，向量用于学习实体和关系嵌入，而在双线性模型和神经网络中则使用额外的矩阵。虽然平移模型使用距离度量来衡量事实的可信度，但双线性模型依赖于实体和关系嵌入的点积。最著名的平移模型之一是TransE[3]。它的简单性使得可以进行直接的扩展[9]。三元组（s，p，o）的平移嵌入对应于s + p ≈ o。评分函数score ( s , p , o)，可以是ℓ1或ℓ2范数，用于衡量距离（即相似性），如下所示：0训练集包含正例（G）和负例（G'），生成方式如下：0G' ( s , p , o ) ∈ G = { ( s ′ , p , o ) | s ′ ∈ E , ( s′ , p , o ) � G 0{ ( s , p , o ′ ) | o ′ ∈ E , ( s , p ,0因此，G'包含将s或o替换为来自集合E的随机实体的三元组。RESCAL[11]，也称为双线性模型，使用张量分解模型来表示张量中的三元组。即，对于每个三元组xijk = (si，pk，oj)，yijk ={0，1}表示其在张量Y ∈ {0，1} |E |×|E |×|R|中的存在或不存在。RESCAL学习实体的向量嵌入和每个关系r ∈R的矩阵Wp ∈ Rd×d，其中每个切片Y被分解为：Y ≈ s � Wpo。因此，双线性模型的评分函数为：0其他值得注意的关系嵌入模型包括HolE[10]和神经张量网络（NTN）[16]。HolE通过使用循环相关操作（压缩两个实体之间的交互）来提高RESCAL的效率，用于评分三元组。几乎所有关系嵌入方法都通过一些训练数据集上最小化基于边界的排名损失函数L。L为0Track: 2018年4月23日至27日，法国里昂举办的第8届时间网络分析研讨会WWW 2018G (s,p,o′[γ+score((s, p, o))−score((s, p, o)′)]+,17730由以下方程给出：0L =0(3)其中[ x ] +表示x的正部分，γ >0是一个边界超参数。不同的优化函数如随机梯度下降被用来最小化L。02.3.3因子分解机。与向量空间嵌入模型不同，因子分解机（FMs）允许我们合并上下文信息，从而提高预测性能。Rendle[12]引入了FMs来使用因子化参数建模特征之间的交互作用。FMs的一个重要优势是即使在非常稀疏的数据情况下，它们也能估计特征之间的所有交互作用。此外，FMs可以模拟许多不同的矩阵分解模型，如有偏矩阵分解、奇异值分解（SVD++）[8]和成对交互张量分解（PITF）[13]。FMs在特征工程方面提供了灵活性以及高预测准确性。此外，FMs可以应用于以下任务：回归、二分类和排序。因子分解机的模型由以下方程给出：0score(x):=w0+0n0i=1wi*xi+0n0i=10j=i+1�vi,vj�xi*xj,0�vi,vj�:=0k0f=1vi,f∙vj,f,0其中score:Rn→T是从实值特征向量x∈Rn到目标域T=R进行预测的函数，用于回归的T=R，用于分类的T={+,−}等等。模型参数：w0表示全局偏差；wi在w∈Rn中表示第i个变量的强度，其中n是特征向量的大小；�vi,vj�表示第i个和第j个变量之间的交互作用。�.,.�是两个大小为k的向量的点积。此外，模型参数V∈Rn×k中的vi描述第i个变量，其中k是定义因子化维度的超参数。在这项工作中，由于我们需要预测（可能有很多）时间点的事实的有效性，我们使用因子化机器进行分类，而不是回归或排序。03 时间范围预测0接下来，我们考虑关系嵌入模型和时间范围预测的分解机。03.1 用于时间知识图的关系嵌入模型0我们提出了各种方法来在向量空间中表示时间知识图。特别地，我们研究了现有关系嵌入方法的几个扩展。03.1.1 TTransE。TTransE是TemporalTransE的缩写，是对众所周知的嵌入模型TransE[3]的扩展，通过替换其评分函数。0(a)Naive-TTransE：时间通过合成关系进行编码。对于词汇表中的每个关系r和每个时间点t∈T，我们假设一个合成关系r:t。例如，时间事实（GCleveland，office，POTUS）:1888，被编码为（GCleveland，office:1888，POTUS）。评分函数保持不变（如方程（1））：0score(s, p: t, o) = -||s + p: t - o||ℓ1/2 (4)0虽然这个模型很简单，但它不可扩展。此外，链接预测不能区分两个连续的时间点，例如对于任务（GCleveland，？，POTUS），office:1988和office:1989都是可能的链接。(b)基于向量的TTransE：在这种方法中，时间在与实体和关系相同的向量空间中表示。评分函数变为：0score(s, p, o, t) = -||s + p + t - o||ℓ1/2 (5)0在这种方法中，时间点具有嵌入表示，就像实体和关系一样。这个评分函数的理论基础是将一个（主体，谓词）对驱动到与任何有效的时间点相对接近的正确对象附近。(c)基于系数的TTransE：时间点（或者更准确地说是其归一化形式）被用作影响三元组的主体和关系嵌入的系数。0得分（s，p，o，t）= −||t�(s+p)−o||ℓ1/2（6）0作为这个的一个变种，只有关系受时间影响：0得分（s，p，o，t）= −||s+t�p−o||ℓ1/2（7）0与基于向量的TTransE不同，时间点以实数值表示在（0，1]之间，因此不会直接受到优化的影响。03.1.2 TRESCAL.TRESCAL是RESCAL的时间扩展。我们将其双线性时间评分函数扩展如下。与Naive-TTransE一样，时间通过合成关系来编码，就像Naive-TTransE一样。0得分（s，p，o，t）= s�Wp:t o（8）0这个模型是双线性模型的直接扩展。尽管它很简单，但它的可扩展性不好，而且预测结果相当差。03.2 用于时间知识图的因子分解机0到目前为止描述的方法中，朴素方法在时间域的尺寸或分辨率不断增加时不具有良好的可扩展性。虽然基于向量的TTransE方法的整体性能优于其他技术，但在实践中它的性能还不足以解决我们的问题。接下来，我们将展示如何使用因子分解机来解决可扩展性和性能问题。0数据/特征表示。我们考虑一个知识图G =Gt∪Gc，其中Gt是一组四元组或时间戳三元组，Gc是一组非时间性三元组，我们称之为上下文图。例如，以下是一个时间图Gt：0（GCleveland，office，POTUS）：1888，（GCleveland，office，POTUS）：1895，0Track: 第8届时间Web分析研讨会WWW 2018，2018年4月23-27日，法国里昂1https://github.com/mnick/scikit-kge2https://github.com/srendle/libfm3http://staff.aist.go.jp/julien.leblay/datasets/17740方法 LR M D E MR（p）Hits@1（p）MR（o）Hits@10（o）MR（t）Hits@10（t）Cost Red.0等式4 0.1 2 100 1000 537.51 0.6 2578.4 11.0 59.2 10.3 99.75%0等式5 0.01 1 200 1000 141.67 22.69 1295.54 13.59 58.44 7.76 45.32%0等式6 0.1 10 100 500 835.22 0.55 9884.69 0.91 58.50 8.62 0.13%0等式7 0.01 2 50 500 796.65 0.18 9374.92 0.19 58.50 8.62 0.45%0等式8 0.01 2 100 1000 483.32 3.1 6588.6 1.9 58.5 12.1 99.99%0表1：我们的时间嵌入方法在FreeBase数据集上的平均排名（MR），Hits@{1,10}和成本减少。0其上下文图Gc如下所示：0（GCleveland，birthPlace，Caldwell）。0FM的输入是一对（Gt，Gc）的特征向量表示。特征向量编码可以通过多种方式构建，例如one-hot编码，词袋模型（将KG中的实体和关系表示为一个袋子或多重集合）等[12]。形如（s，p，o）的事实相关的特征为{bow(s)，p，bow(o)}，其中bow(x)返回与主体x相关的所有文字的词袋。0示例生成。为了生成正例，我们使用时间采样，由输入参数TS引导，该参数在事实的有效性间隔内均匀采样st个时间点。第二个参数NS引导负采样，对每个基于时间点的正例事实/示例使用与[3]中相同的随机破坏技术生成sn。04 实验0我们基于RESCAL和TransE的scikit-kge库以及libFM/pywFM库实现了我们的方法。04.1 数据集0我们最初在相关工作中经常使用的Freebase数据库上进行了实验（我们的第一组实验）。然而，该数据集上的事实没有时间信息，我们随机为其中的一部分事实生成了这样的元数据，选择了两个随机年份并将其用作开始和结束有效日期。因此，很难将我们的结果与非时间关系嵌入场景中的相应工作进行比较。Freebase大约有14K个实体，1000个关系，有60k个示例。后来，我们决定切换到Wikidata，这是一个具有相对高质量时间信息的知识库。此外，Wikidata规模更大且更为更新。我们只简要介绍了在前一个数据集上获得的结果，而且结果大部分是负面的。此外，由于缺乏可利用的辅助信息，无法使用因子分解机方法处理Freebase和WordNet数据集；这些数据集中几乎没有纯文本。我们在准备Wikidata数据集时的过程如下：我们从最近的数据转储中提取三元组，并将其分成两组：（i）时间事实：具有某些时间注释的事实，例如时间点、开始时间、结束时间或任何子属性，（ii）非时间事实：没有这些注释的非时间事实。注释时间事实的时间属性包括“开始时间”、“开始时间”、“拆除时间”等。在本文中，我们只0考虑到年份，因此将所有年份归一化为公历，并丢弃更细粒度的信息。带有单个时间点的事实与该时间点关联为起始时间和结束时间。在学习阶段，时间事实用于生成正面和负面示例，而非时间事实用于收集附加信息。完整数据包含4.2M个时间事实。在大约3600个不同属性中，有2770个严格非时间性，即它们对应的三元组没有时间注释。在剩下的属性中，有17个严格时间性，即它们的所有对应三元组都有时间注释，而对于其余的813个属性，只有一些三元组有注释。我们将三元组分为两组，分别具有和没有时间注释，前者是我们的原始示例集。从这个示例集（时间事实）中排除严格时间性的示例（因为它们不适用于预测），包含最频繁的单一属性的事实（覆盖近120万个示例），以及具有少于10个示例的属性（约397个属性）。最终，我们的示例集包含2.5M个示例，比相关方法中使用的大多数数据集要多得多（例如，参见[3,10]）。我们还报告了我们在该数据集的缩小版本上的结果，其中包含180K个时间注释事实（即总体数据的约5%）。我们的数据集可以在线找到以供复现[3]。第二组三元组（非时间事实）用于生成特征。我们还删除了具有低语义内容的三元组集，例如将Wikidata实体ID映射到其他数据集的三元组。04.2 时间关系嵌入0对于这个实验，我们使用了修改后的Freebase数据集，并使用了与相关工作中略有修改的版本，该版本使用查询三元组进行评估，即省略了一个项目并需要模型进行预测。对于查询回答，省略了s或o，而在链接预测中省略了p。评估指标是正确答案在所有按其预测概率排序的答案中的平均排名。数值越低越好。指标还包括“Hits@K”，即正确答案在前K个结果中的百分比。Hits@10是一个常用的指标，但对于小领域（如链接预测），通常更喜欢Hits@1。在我们的设置中，我们处理四元组，因此我们将该过程扩展到时间预测，其中省略了时间，并评估预测的有效时间点在事实的实际有效区间内的频率。在表1中，我们仅报告了每种方法获得的最佳结果。我们使用的学习率（LR）在0Track: 第8届时间Web分析研讨会 WWW 2018，2018年4月23日-27日，法国里昂WD_180KALS158.44%71.27%64.22%60.23%WD_180KALS1067.94%88.95%77.04%73.48%WD_180KALS10074.56%92.47%82.56%80.45%WD_2.5MALS1078.15%97.64%86.81%85.16%WD_180KMCMC164.98%81.07%72.14%68.64%WD_180KMCMC1069.55%89.69%78.35%75.21%WD_180KMCMC10079.28%92.28%85.28%84.07%WD_2.5MMCMC1085.41%97.64%91.12%90.48%17750OM TS 精确率召回率 F1 准确率0表2：在WD_180K数据集上，根据不同的时间采样进行的精确率、召回率、F1-measure和准确率的变化（OM：优化方法，TS：时间采样大小）。0{.01, .1}, 边距（M）在{2, 10}之间，向量空间的维度（D）在{20, 50,100,200}之间，学习500或1000个时期（E）。从表中可以看出，性能并不令人满意。然而，我们可以区分出两个一般性问题。对于天真的方法（Eq.4-8），由于这些方法所涉及的“虚拟关系”的乘法，空间会爆炸。尽管通过学习过程实现了显著的成本降低，但性能仍然很差。然而，其他方法并没有实现太多的成本降低。我们对此的最佳解释是，仅仅从图的结构（即，不使用其他外部信息）来看，学习时间的有效性太难了。这个结论使我们转向了因子分解机方法，更类似于包含了附加信息。04.3 FM上的分类任务0对于分类任务，学习是在形式为（s，p，o，t）=±1的四元组上进行的，模拟三元组（s，p，o）在时间t是否成立。采样后，实际示例的数量增加。例如，对于TS =3，（GCleveland，office，POTUS）：[1885，1889]，将为时间点1885、1887、1889生成正例。反过来，评估是在时间点上进行的，而不是时间间隔上进行的。我们使用标准的预测、召回率、F1度量和准确度定义。这些度量的定义如下：0精确度 = 真正例数0# 正例预测0召回率 = 真正例数0# 真实正例0F-度量 = 2 × 精确度 × 召回率0准确度 = 正确预测数0# 所有预测0我们使用了交替最小二乘（ALS）和马尔可夫链蒙特卡洛（MCMC）作为优化函数。我们在表2中报告了精确度、召回率、F1度量和准确度的结果，该表显示了在一个包含180K和2.5M个示例的Wikidata数据集上进行的实验结果，使用词袋作为附加信息，并增加了时间采样大小。由于负例的数量较多，高NS的结果被省略，这会使模型倾向于负预测，导致准确度较高，尽管精确度较低。通过使用平衡的正负例集合0在负例中，精确度与TS呈正相关。使用100个时间采样和我们较小的数据集，精确度和召回率在100次迭代后分别达到74.5%和92%，F1度量和准确度约为82%。使用时间采样大小为10和我们较大的数据集，F1度量和准确度达到90%。增加样本大小也会提高性能，但是在时间间隔内为所有时间点生成正例会降低性能，可能是由于过拟合。我们的结果还表明，只需10次迭代即可达到约70%的精确度。我们最耗时的实验在普通笔记本电脑上花费了略多于6个小时，配备16GB的RAM和2.8 GHz的Intel Corei5处理器。我们已经排除了TTransE和TRESCAL的实验结果，因为我们的结果表明这些方法并不具有竞争力。05 结论0在这项工作中，我们研究了时间范围预测的问题。我们采用了几种现有的关系嵌入方法，实验结果表明它们要么缺乏可扩展性，要么缺乏准确性。因子分解机克服了这些缺点，因为它们提供了一种将附加信息纳入预测性能的方法。我们通过仔细分析Wikidata设计了一个新的数据集，并进行了几个实验。我们相信我们的实验结果非常有前途。接下来，我们计划将注意力转向基于神经网络的方法，扩展我们当前的框架以支持时间感知的链接预测和查询回答，并将我们的发现应用于其他类型的上下文预测，如空间或来源。我们还计划将该方法应用于开放信息提取设置中。0参考文献[1] Sören Auer，Christian Bizer，Georgi Kobilarov，Jens Lehmann，RichardCyganiak和ZacharyIves。2007年。Dbpedia：开放数据网络的核心。在语义网络。Springer，722-735。[2]Brett W Bader，Richard A Harshman和Tamara GKolda。2007年。使用ASALSAN对语义图进行时间分析。在数据挖掘，2007年。ICDM2007年第七届IEEE国际会议。IEEE，33-42。[3] Antoine Bordes，NicolasUsunier，Alberto Garcia-Duran，Jason Weston和OksanaYakhnenko。2013年。用于建模多关系数据的嵌入翻译。在神经信息处理系统的进展。2787-2795。[4] Andrew Carlson，Justin Betteridge，Bryan Kisiel，BurrSettles，Estevam R Hruschka Jr和Tom MMitchell。2010年。迈向永不结束的语言学习的架构。在AAAI，第5卷。3。[5] XinDong，Evgeniy Gabrilovich，Geremy Heitz，Wilko Horn，Ni Lao，KevinMurphy，Thomas Strohmann，Shaohua Sun和WeiZhang。2014年。知识库：一种面向Web规模的概率知识融合方法。在SIGKDD。601-610。[6] Johannes Hoffart，Fabian M Suchanek，Klaus Berberich，EdwinLewis-Kelham，Gerard De Melo和GerhardWeikum。2011年。YAGO2：在时间、空间、上下文和多种语言中探索和查询世界知识。在第20届国际万维网会议伴随会议记录上的论文。ACM，229-232。[7] TingsongJiang，Tianyu Liu，Tao Ge，Lei Sha，Baobao Chang，Sujian Li和ZhifangSui。2016年。面向时间感知的知识图谱完成。在COLING。1715-1724。[8] YehudaKoren。2008年。因子化遇到邻域：一个多方面的协作过滤模型。在第14届ACMSIGKDD国际会议上的知识发现和数据挖掘会议记录。ACM，426-434。[9] Dat QuocNguyen。2017年。实体和关系嵌入模型用于知识库完成的概述。arXiv预印本arXiv:1703.08098（2017）。[10] Maximilian Nickel，Lorenzo Rosasco，Tomaso APoggio等。2016年。知识图的全息嵌入。在AAAI。1955-1961。[11] MaximilianNickel，Volker Tresp和Hans-PeterKriegel。2011年。一种用于多关系数据的集体学习的三路模型。在第28届国际会议上的论文0Track: 2018年4月23日至27日，法国里昂举办的第8届时间Web分析研讨会WWW 201817760国际机器学习会议(ICML-11) . 809–816. [12] Steffen Rendle. 2012. 具有libfm的分解机.ACM Transactions on Intelligent Systems and Technology (TIST) 3, 3 (2012), 57. [13]Steffen Rendle和Lars Schmidt-Thieme. 2010. 用于个性化标签推荐的成对交互张量分解.在第三届ACM国际网络搜索和数据挖掘会议论文集中. ACM, 81–90. [14] Anisa Rula,Matteo Palmonari, Axel-Cyrille Ngonga Ngomo, Daniel Gerber, JensLehmann和Lorenz Bühmann. 2014. RDF数据的混合获取时间范围.在欧洲语义Web会议中. Springer, 488–503. [15] Avirup Sil和Silviu Cucerzan. 2014.基于维基百科数据的关联事实的时间范围. CoNLL-2014 (2014), 109. [16] Richard Socher,Danqi Chen, Christopher D Manning和Andrew Ng. 2013.使用神经张量网络进行知识库补全的推理. 在神经信息处理系统进展中. 926–934.0[17] Partha Pratim Talukdar, Derry Wijaya和Tom Mitchell. 2012.关联事实的耦合时间范围. 在第五届ACM国际网络搜索和数据挖掘会议论文集中. ACM,73–82. [18] Volker Tresp, Yunpu Ma, Stephan Baier和Yinchong Yang. 2017.嵌入学习用于声明性记忆. Springer International Publishing, Cham, 202–216. DOI:https://doi.org/10.1007/978-3-319-58068-5_13 [19] Rakshit Trivedi, MehrdadFarajtabar, Yichen Wang, Hanjun Dai, Hongyuan Zha和Le Song. 2017. Know-Evolve:时间知识图中的深度推理. arXiv预印本arXiv:1705.05742 (2017). [20] DennyVrandečić和Markus Krötzsch. 2014. Wikidata: 一个免费的协作知识库. Commun. ACM57, 10 (2014), 78–85. [21] Derry Tanti Wijaya, Ndapandula Nakashole和Tom MMitchell. 2014. CTPs: 使用状态变化检测的时间范围内的上下文时间概要文件. 在EMNLP中.1930–1936.0Track: 2018年4月23日至27日，法国里昂举办的第8届时间Web分析研讨会WWW 2018

下载后可阅读完整内容，剩余1页未读，立即下载