神经网络BodyNet：直接推断三维人体形状的革命性方法

64 浏览量更新于2024-06-20 收藏 1.23MB PDF 举报

BodyNet是一项创新的深度学习技术，专注于基于神经网络的直接推理三维人体形状，这对于视频编辑、动画制作和服装行业的实时人体建模至关重要。传统的3D人体形状估计方法往往依赖于姿势和形状的先验知识，通过参数化身体模型进行拟合。BodyNet则提出了一种不同的方法论，它采用了一个端到端可训练的神经网络架构。 BodyNet的核心优势在于其设计，它不仅考虑了3D损失，以确保生成的三维形状的准确性，还引入了多视图重新投影损失，这有助于确保模型对不同视角的一致性。此外，网络还利用了中间监督，即同时训练2D姿态和2D身体部位分割，以及3D姿态，这种多层次的监督机制显著提升了模型的性能。实验部分展示了BodyNet在SMPL模型上的表现，它在SURREAL和UnitythePeople等数据集上实现了最先进的结果，超越了先前的研究。这表明BodyNet不仅在精度上有所突破，而且在实际应用中的效果也非常出色。值得一提的是，BodyNet的独特之处在于它能够直接从单张图像中推断出体积体型，甚至提供了身体部位的分割，这对于那些需要精细形状信息的应用来说是一大进步。与传统方法相比，BodyNet面临的挑战主要包括训练数据的缺乏，特别是在大规模无约束环境中，以及如何选择最合适的三维表示。然而，通过利用深度学习的强大处理能力，BodyNet克服了这些问题，展示了在自然图像预测三维人体形状领域的巨大潜力。 BodyNet是现代计算机视觉领域的一项重要进展，它革新了我们理解和生成三维人体形状的方式，为未来的虚拟现实、增强现实和交互设计等领域开辟了新的可能性。它的成功证明了直接推理方法在复杂场景下可以提供更精确、更自然的人体模型预测，从而推动了相关行业的发展。

瓦罗尔，锡兰，拉塞尔，杨，尤默，拉普捷夫，

施密德

通过密集采样的2D点的性能。Huang

等人

. [42]扩展SMPLify用于具有时间

先验的多视图视频序列。[43]中使用了类似的时间约束。Rhodin等人[44]

使用高斯和体积表示以及基于轮廓的细化，并利用优化技术成功地演示

了从多视图视频中恢复人体形状。即使这样的方法显示出令人信服的结

果，但是它们固有地受到它们使用的2D检测的质量的限制，并且依赖于

先验两者。对姿态和形状参数进行调整，以使高度复杂和昂贵的优化

过程规则化。

深度神经网络提供了一种可以期待的替代方法从数据中自动学习适

当的先验知识。Dibra等人[45]提出了这个方向的第一种方法之一，并训

练CNN从轮廓估计3D形状参数，但假设正面输入视图。最近的方法

[14Tan等人[14]设计编码器-解码器架构，该架构在轮廓预测上进行训

练，并间接回归模型参数瓶颈层。Tung等人[15]对两个连续的视频帧进

行操作，并通过对光流、细孔和2D接头上的重投影损失进行积分来学习

参数。类似地，Kanazawa

et al

. [16]预测2D关节上具有重投影损失的参

数，并引入目标是区分不现实的人体形状的对手。

即使可变形体模型的参数提供了3D形状的低维嵌入，但是用网络预测

这样的参数需要学习高度非线性映射。在我们的工作中，我们选择了一

种替代的体积表示，该表示已被证明对通用3D对象[21]和面部[46]有效。

[21]的方法对一些刚性对象类别（如椅子和桌子）的低分辨率灰度图像进

行操作。我们认为，人体更具有挑战性，由于显着的非刚性变形。为了

适应这种变形，除了2D姿态之外，我们还使用分割和3D姿态作为3D形状

的代理[46]。在给定的3D姿态上调节我们的3D形状估计，网络专注于形

状变形的更复杂的问题。此外，我们用额外的重投影损失来正则化我们

的体素预测，用中间超视执行端到端的多任务训练，并获得体积身体部

位分割。

其他人已经研究了预测人体的2.5D投影。DenseReg [47]和DensePose [48]

估计图像到表面的对应关系，而[33]输出SMPL主体的量化深度图。与这

些方法不同，我们的方法生成一个完整的3D身体重建。

多任务神经网络多任务网络已经得到了很好的研究。一种常见的

方法是在神经网络架构的最末端输出多个相关任务另一种最近探

索的替代方案是堆叠

多个子网络并提供具有

中间监督的指导

。在这

里，

我们只涵盖采用后一种方法的相关作品。用相关线索指导

CNN已经显示出许多任务的改进例如，2D面部标志已经显示出对

3D面部重建的有用指导[46]以及类似的动作识别光流[49]。然而，

这些方法不执行联合训练。[50]的最新工作联合学习2D/3D姿态

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

神经网络BodyNet：直接推断三维人体形状的革命性方法

matlab代码循环运行-bodynet:BodyNet：3D人体形状的体积推断，ECCV2018

matlab smpl

基于大模型技术的算力产业监测服务平台设计

This_honeypot_supports_Telnet_and_SSH_two_protocol_FF-Pot.zip

吉他谱_What I've Done - Linkin Park.pdf

吉他谱_Too sweet - Hozier.pdf

Linux使用的一些笔记，包括shell命令，软件，一些实用的网站的整理_Linux_note.zip

基于ssm的机房预约系统设计与实现.docx

app执行Linux命令_app-Linux-.zip

吉他谱_Would - Alice in Chains.pdf

最新资源