Keras Embedding层masking与Concatenate层冲突解决方案

65 浏览量更新于2024-09-01 收藏 72KB PDF 举报

"解决Keras中Embedding层masking与Concatenate层不可调和的问题" 在Keras框架中，Embedding层常用于将整数序列（通常是词汇索引）转换为连续向量表示，这对于自然语言处理（NLP）任务非常有用。masking机制允许我们忽略输入序列中的填充值，例如在变长序列中，较短的序列会被填充到相同的长度。然而，当在模型中同时使用masking和Concatenate层时，可能会遇到一些问题。问题的核心在于，当一个Embedding层设置了`mask_zero=True`时，它会在输出中添加一个额外的维度，这个维度的值为1，用于表示填充的mask。而另一个没有设置`mask_zero`或设置为`False`的Embedding层则不会添加这样的维度。在将这两个Embedding层的输出通过Concatenate层连接时，由于它们的维度不匹配，Keras会抛出一个错误，指出两个矩阵的维度0不相等。错误信息： ``` ValueError: Dimension 0 in both shapes must be equal, but are 1 and 5. Shapes are [1] and [5]. ``` 这表明在尝试连接的张量中，一个的第三维是1，另一个是5，导致维度冲突。为了解决这个问题，我们可以采取以下几种策略： 1. **统一masking**：确保所有使用masking的Embedding层都设置`mask_zero=True`，并且在需要的地方处理填充值。这样，所有输出都会有相同的额外维度，可以被Concatenate层接受。 2. **移除masking**：如果可能，可以考虑不使用masking，而是通过其他方式在后续计算中处理填充值。例如，在模型的最后阶段使用Masking层，或者在损失函数中排除填充值的影响。 3. **自定义Layer**：创建一个自定义的层，该层能够处理不同维度的输入，并在内部处理masking。这可能涉及到在concatenation之前添加或移除masking维度。 4. **手动调整形状**：在concatenation之前，通过重塑操作（Reshape或Lambda层）来调整输入张量的形状，使其维度匹配。在描述中提到的代码示例中，作者尝试将`axis=1`改为`axis=2`进行concatenation，这样就避开了masking维度的冲突，因为两个Embedding层的输出在第二维上是匹配的。这种方法可以解决特定情况下的问题，但并不总是通用的解决方案。 Keras中的masking机制与某些层的组合可能会引起维度不匹配的问题，尤其是在处理变长序列时。理解masking的工作原理以及如何与其他层交互，对于构建有效且无错的模型至关重要。在实际应用中，应根据具体需求选择合适的解决方案，以确保模型能够正确地处理数据并避免出现错误。

解决解决Keras中中Embedding层层masking与与Concatenate层不可调层不可调

和的问题和的问题

主要介绍了解决Keras中Embedding层masking与Concatenate层不可调和的问题，具有很好的参考价值，希望

对大家有所帮助。一起跟随小编过来看看吧

问题描述问题描述

我在用Keras的Embedding层做nlp相关的实现时，发现了一个神奇的问题，先上代码：

a = Input(shape=[15]) # None*15

b = Input(shape=[30]) # None*30

emb_a = Embedding(10, 5, mask_zero=True)(a) # None*15*5

emb_b = Embedding(20, 5, mask_zero=False)(b) # None*30*5

cat = Concatenate(axis=1)([emb_a, emb_b]) # None*45*5

model = Model(inputs=[a, b], outputs=[cat])

print model.summary()

我有两个Embedding层，当其中一个设置mask_zero=True，而另一个为False时，会报如下错误。

ValueError: Dimension 0 in both shapes must be equal, but are 1 and 5.

Shapes are [1] and [5]. for 'concatenate_1/concat_1' (op: 'ConcatV2')

with input shapes: [?,15,1], [?,30,5], [] and with computed input tensors: input[2] = <1>.

什么意思呢？是说在concatenate时发现两个矩阵的第三维一个是1，一个是5，这就很神奇了，加了个mask_zero=True还会

改变矩阵维度的吗？

寻找问题根源寻找问题根源

为了检验Embedding层输出的正确性，我把代码改成了：

a = Input(shape=[30])

...

cat = Concatenate(axis=2)([emb_a, emb_b])

运行成功了，并且summary显示两个Embedding层输出矩阵的第三维都是5。

这就很奇怪了，明明没有改变维度，为什么会报那样的错误？

然后我仔细追溯了一下前面的各项error，发现这么一句：

File ".../keras/layers/merge.py", line 374, in compute_mask

concatenated = K.concatenate(masks, axis=self.axis)

难道是难道是mask的拼接有问题？的拼接有问题？

于是我修改了/keras/layers/merge.py里的Concatenate类的compute_mask函数（sudo vim就可以修改），在返回前输出一下

masks：

def compute_mask(self, inputs, mask=None):

...

for x in masks:

print x

return ...

Tensor("concatenate_1/ExpandDims:0", shape=(?, 30, 1), dtype=bool)

Tensor("concatenate_1/Cast:0", shape=(?, 30, 5), dtype=bool)

发现了！有一个叫concatenate_1/ExpandDims:0的mask它的第三维度是1！

那么这个ExpandDims是什么鬼，观察一下compute_mask代码，发现了：

...

elif K.ndim(mask_i) < K.ndim(input_i):

# Mask is smaller than the input, expand it

masks.append(K.expand_dims(mask_i))

...

意思是当mask_i的维度比input_i的维度小时，扩展一维，这下知道第三维的1是怎么来的了，那么可以预计compute_mask函

数输入的mask尺寸应该是(None, 30)，输出一下试试：

def compute_mask(self, inputs, mask=None):

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38663544

粉丝: 4
资源: 969

Keras Embedding层masking与Concatenate层冲突解决方案

Keras—embedding嵌入层的用法详解

Keras自定义实现带masking的meanpooling层方式

Keras实现支持masking的Flatten层代码

concatenate层

tf.keras embedding层详解

怎么用Keras构建embedding

keras中的embedding 层

如何让keras的Embedding输出二维张量

from keras.layers.merging.concatenate import concatenate，在新版keras这个导入已经失效，应该改为什么

Embedding 在keras中使用参数说明

最新资源