5
0
Arxiv预印本版本2021
0
图3:运算符和参数采样网络以及对采样的离散动作的RL框架
0
2.1.2离散推理建模
0
接下来,模型学习基于最终程序步骤执行单个离散推理步骤1(图3)。最终步骤包含(i)查询的根子
句,通常指示离散操作的类型(例如,“最长的是什么”表示max,“有多少目标”表示count),以
及(ii)参考参数,指示最终步骤依赖于先前的程序步骤。每个先前步骤(例如k)都表示为堆叠的注
意力图Tnumk和Tdatek,这些图是从§2.1.1中获得的。
0
运算符采样网络由于程序的噪声特性,运算符网络以以下内容作为输入:(i)BERT的[CLS]表示,用
于段落-查询对和LSTM(Hochreiter&Schmidhuber,1997)编码(随机初始化)BERT上下文表示
的根子句,以及(iii)完整查询(相对于段落),以进行两个预测:
0
•实体类型预测网络,指数线性单元(Elu)激活的全连接层,后面是一个softmax,输出采样日期或数字类型的概率。
0
•
运算符预测网络,类似的Elu激活的全连接层,后面是一个softmax,学习一个概率分布,覆盖了一个固定的6个
数字和逻辑运算(count、max、min、sum、diff、negate)的目录,每个运算符都用可学习的嵌入表示。
0
除了diff运算符只作用于两个参数外,所有其他操作都可以接受任意数量的参数。此外,其中一些操
作只能应用于数字(例如sum,negate),而其他操作可以应用于数字或日期(例如max,count)
。
0
参数采样网络该网络学习为采样的离散操作的参考参数中的日期/数字实体作为参数,给定每个先前
步骤(例如,k)中出现在最终程序步骤的参考参数中的实体特定堆叠注意力(Tnumk和Tdate
k)。为了允许采样固定或任意数量的参数,参数采样器学习四种类型的网络,每种网络都使用L层堆
叠的自注意力Transformer块(输出维度为d),后面是不同的非线性层体现其功能和softmax归一化
,以获得参数采样的相应概率(图3)。
0
•随机抽取n∈{1,2}参数模块:softmax(Elu(线性d×n(Transformer(T)))),输出单个实体
(n=1)或实体对(n=2)的分布。
0
•计数模块:softmax(Elu(线性d×10(CNN-编码器(Transformer(T))))),预测可能的
实体参数数量(∈[1,...,10])的分布。
0
•实体排序模块:softmax(PRelu(线性d×1(Transformer(T)))),学习对实体进行重新排
序,并在给定堆叠的注意力图作为输入时输出所有实体的分布。
0
•随机抽取任意参数:多项式(实体排序分布,计数预测)。
0
根据离散操作所需的参数数量和最终程序步骤中的参考参数数量,模型调用Sample{1,2,Arbitrary}
Argument之一。例如,如果抽样操作符是diff,需要2个参数,并且最终步骤有1个或2个参考参数,则模型
分别在对应于每个参考参数的堆叠注意力T上调用Sample2argument或Sample1
argument。对于需要任意数量参数的操作,模型调用SamplingArbitraryArgument。对于Arbitrary
Argument情况,模型首先使用计数网络预测要抽样的实体数量c∈{1,...,10},然后根据实体排序模块的输出
分布构造的c组合的联合上的多项式分布进行抽样。
0
1对于DROP,这是一个合理的假设,训练集的召回率为90%。然而,它不限制WNSMN的泛化能力,因为使用标
准波束搜索可以扩展到l步MDP。
0
+v:mala2255获取更多论文