图3. 方法-我们用一个简单的二维例子来说明我们的方法,回归一个等边三角形的三维顶点给定多视图观察。(左)AniPose
[33]
执行经典的束调整,以识别摄像机位置和
3D
顶点,最大限度地减少输入图像上
2D
地标的重投影误差。相反,我们的技术
通过元优化器以
“
神经
”
方式
模拟
经典的束调整:首先(中),
EpipolarPose [ 37 ]
神经网络获得关节的每帧
3D
估计,我们通过
procrustes共同对齐以获得相机参数和关节位置的初始猜测;然后(右),神经网络元优化器执行捆绑调整,并使用每个视图的
关键点定位热图作为输入来优化关节和相机。额外的先验信息,例如三角形是等边的事实,可以优雅地集成到元优化器训练
中。
3.
方法
如图3所示,给定一组
c
图像,我们寻求优化,直到全
局旋转,缩放和移位:
运算符定义为π(
j
,
(
R
,
t
,
s))
=
s
I
[0
:
1]
R
j+
t其中
I
[0:1]
是丢弃相乘向量的第三维度的截断单位矩阵。这
个选择的
相机模型简化了相机参数的初始化
从单视图3D姿态估计(第3.2节)和消除重投影奇点
(补充第3.2节)。7.6)。
在第5节中,我们通过实验证明了
最终的错误来自于相机型号的选择。
推理任务。我们的推理任务是估计
来自观察到的热图H的J和C。 我们首先介绍-
将概率光束法平差公式化,
假设在训练时,我们得到:
•
K=
k
j
,
c
:关节j
j
在摄像机c
c
中的投影的地面实况
2D
位置
。
贝叶斯模型形式上,假设热图仅通过2D关键点位置
(即,p(H|K
,
J
,
C)
=
dle关节位置不确定性,然后提出一个回归模型,该模
型对关节位置和观察到的热图之间的复杂相互作用进
行整体推理任务可以被定义为在给定观察到的热图的
情况下找到姿势和相机参数的后验概率的最大值,在
可能的关键点位置上被边缘化:
max
p
(J
,
C
|
H)=
�
p
(k
)
|
H)
p
(k
|
J
,
C)
p
(J)
p
(C)
dk(
3
)
p
(
J
,
C
,
K
,
H
)
=
p
(
H
|
K
)
p
(
K
|
J
,
C
)
p
(
J
)
p
(
C
)(
1
)
假设关节和关键点通过以下方式相关:
p
(
K
|
J
,
C
)
=
δ
(
k
j
,
c
−
π
(
j
j
,
c
c
))
(
2
)
j
,
c
其中δ是狄拉克分布,π(j
,
c)将关节j投影到摄像机
c中的2D坐标。我们使用弱投影相机模型,因此,每
个相机由旋转矩阵R、像素移位向量t和单尺度参数s
的