方法采用了预先训练的[81]或可训练的[41,63]基于
CNN的特征提取器。具体来说,[22]提出了一种分层度
量学习策略,以学习更好的几何匹配特征描述符。然
而,所有的网络都与传统的匹配方法相结合。
2017年,Rocco et al.提出了第一个用于2D图像几何
匹配的端到端卷积神经网络[69]。这种完全监督的模型
利用预先训练的网络[77]来从要匹配的两个图像中提取
特征。然后,相关层匹配由网络跟踪的特征,以回归
到用于监督训练的已知变换参数。后来,他们将这个
模型扩展为弱监督模型,以找到类别级别的
[70]和实例级对应[71]。其他弱监督方法已被提出用于
类似的任务,包括语义属性匹配[42],同时对齐和分割
[80],以及大类内变化下的对齐然而,它们仍然需要额
外的训练监督,例如在实例级别或类别级别上匹配图
像对。
2.2.
无监督光流估计
光流估计使用密集或稀疏向量场来描述2D图像序列
中像素的小位移早期的无监督方法使用门控限制玻尔
兹曼机来学习图像变换[56,57]。最近基于CNN的方法
应用了帧插值[49],遮挡推理[38]和亮度恒定性方面的
无监督损失
[39]或双向普查[53]。虽然这些方法都是无监督的,但
它们要求输入图像高度相似,只有很小的像素偏移。
2.3.
无监督形变医学图像配准
3D图像配准是对2D光流估计的3D模拟。可变形图
像 配 准 已 广 泛 应 用 于 3D 医 学 图 像 , 如 脑 MRI [85 ,
59]、CT [33,76]和心脏图像[91,72]。最近的工作提
出了基于空间变换函数[18,4,17]或生成对抗网络
[52,40]的无监督CNN模型。与光流估计类似,这些方
法要求固定体积和移动体积的输入对来自两个体积的
信息通过将它们堆叠为CNN模型的一个输入然而,当
存在强 变 换变化时,简单地堆 叠输入图像对效果不
佳,因为图像相似性比较在空间上被限制在局部邻域
[55]。
2.4.
基于非学习的子断层图像对齐
早期的工作已经使用了穷尽网格搜索的旋转
和平移
与固定的间隔,如
1
体素和
5
像素
以对齐子断层图像[8,24,3]。为了减少穷尽搜索6D
参数空间的计算成本,[87]中提出的高通量对齐应用了
快速旋转匹配算法[43]。[13]中提出的快速准确对准也
使用了快速旋转匹配算法,并将包括幅度和相位在内
的更多信息纳入其程序。另一种方法是基于核规范[46]
将多个子断层图协同对齐。
在本文中,我们专注于成对子断层图像对齐,并将
我们的方法与两种最流行的子断层图像对齐方法作为
基线进行比较[87,13]。
3.
方法
我们的模型如图1所示(详细架构见补充部分S2)。
使用 具有共享权重的特征提取器处理两个子断层图
(3D灰度立方体图像)s
a
和s
b
,以产生两个
特征图v
a
和v
b
。然
后,一个Siamese匹配模块计算两个相关图
cab
和
cba
。在
特定位置(i,j,k)处,c
ab
包含该位置(i,j,k)处
的v
a
与v
b
的所有特征之间的相似性,而c
ba
被类似地定
义。c
ab
和c
ba
使用相同的网络体系结构进行处理,并在
稍后连接以估计
变换参数。ZYZ变换中的三维变换参数
φ
tr
={
qx
,
qy
,
qz
}
和三维旋转参数
φ
rot
={q
α
,
q
β
,
q
γ
}
被输入到一个可微的
空间Transformer中
网 络 计 算 输 出 , 转 换 后 的 子 断 层 图 像
s
b
=
T
φ
(
s
b
)
=
T
φ
tr
T
φ
rot
(
s
b
) , 缺 失 的 楔 形 区 域 被 输 入 ( 第 3.3
节)。将光谱数据插补技术集成到空间Transformer网
络中,
补偿缺失的楔形效应。在训练过程中,我们没有像[69]
中那样回归的地面真值转换参数。因此,为了评估几
何匹配性能,我们的目标是找到3D刚性变换参数,以
最大化在无监督的fashion中的
sa
和
sa
b
之间的互相关。基
于互相关的损失被反向传播以更新模型权重。
3.1.
特征提取模块
特征提取是一个降维过程,用于有效地学习原始图
像的感兴趣部分的紧凑特征向量表示。有各种流行的
特征提取技术,如DenseNet [34],InceptionNet [79]和
ResNet [32] 。 在 这些 卷 积 神经 网络 中 使 用子 采 样 方
法,如最大池化和平均池化,以降低特征映射的维数
并便于计算。与最大池化和平均池化相比,卷积神经
网络的谱表示为每个参数保留了更多的空间信息,并
实现了