没有合适的资源?快使用搜索试试~ 我知道了~
单图深度监督内在分解:基于DCNN的阴影与着色图像分离
沙特国王大学学报从单个图像进行深度监督的内在分解S. 作者:Sharan Ranjit,Raj K.贾伊斯瓦尔河BITS Pilani,K.K Birla Goa Campus,果阿邦,印度阿提奇莱因福奥文章历史记录:2021年5月11日收到2021年9月3日修订2021年9月5日接受2021年9月17日网上发售保留字:CNN迁移学习本征分解反照率图像着色图像A B S T R A C T将RGB图像分离成它的阴影和着色贴图抽象了内在图像分解背后的思想这是一个长期的和模糊的计算机视觉问题,我们提出了一个有效的方法。这项工作是试图通过使用基于深度卷积神经网络(DCNN)的编码器-解码器架构将单个图像分解为其阴影和我们的模型使用预训练的DenseNet作为输入图像的编码器和两个输出图像的解码器,即。阴影和阴影。来自MPI-Sintel数据集的合成图像用于通过监督方法训练我们的模型我们展示并分析了我们的模型在合成图像和真实图像上的结果,DenseNet-121和DenseNet-169都是编码器。我们的方法旨在减少训练时使用的参数数量,并且与以前的MPI-Sintel数据集方法相比,产生了更好的结果版权所有©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍内在图像分解是基于将单个RGB图像分解阴影贴图描述了物体表面材质如何反射光线,而着色贴图则说明了由于几何和阴影而产生的照明效果对于我们的方法,我们考虑基于理想漫射环境的核心本征图像模型,其中输入图像(I)是灰度(A)和阴影(S)的逐像素乘积(一).一个本征分解的例子如图所示。1.一、我爱你这种分解在许多计算机图形/视觉任务中起着重要作用,例如增强现实,高级图像编辑和材料识别。得到的阴影图可用于图像分割,而阴影图有助于3D重建和深度估计。在呈指数级增长的增强现实和虚拟现实领域中,获取渲染和着色地图最终将成为基本任务。*通讯作者。电子邮件地址:jaiswal. gmail.com(R.K. Jaiswal)。沙特国王大学负责同行审查我们相信,使用深度学习技术可以有效地自动获取这些地图,这是我们工作的主要动机。为解决这一问题而进行的持续研究和开发产生了各种各样的方法。虽然传统的人工神经网络仍然可以解决手头的任务,但深度神经网络的使用已经占了上风,并产生了更好的结果。基于CNN的网络的丰富性和有效性已经影响了许多计算机视觉任务,并且内在分解也没有被排除在外。数据在任何深度学习方法中都扮演着重要的角色,而获取真实场景的地面真实数据是极其困难的。因此,我们使用由计算机生成的地面实况图像组成的合成数据集。此外,这个任务在规模上具有固有的模糊性,因为对于等式2,可能有无限多个解。(1),这启发了我们使用尺度不变损失。我们提出了一个基于CNN的编码器和解码器的架构,其中包括一个编码器和两个解码器。通过使用迁移学习技术,我们是一个简单的架构,减少了参数的数量。我们使用迁移学习的动机来自于它在许多突出的计算机视觉任务中的成功,如对象检测、图像分割等。迁移学习也成功地解决了类似的模糊问题,如人的重新识别(Grigorev等人,2019)、单图像超分辨率(Shi等人,2018年),还有更多。我们的主要贡献可归纳如下:我们提出了一个具有深度监督的编码器-解码器架构,使用DenseNet作为我们的预训练编码器。https://doi.org/10.1016/j.jksuci.2021.09.0061319-1578/©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.com●S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报8648Fig. 1.本征图像分解为反照率和阴影。在DenseNet和深度监督的帮助下,我们大大减少了所需的可训练参数的数量据我们所知,我们是第一个使用结构相似性指数(SSIM)作为损失函数的内在分解。这有助于对我们的模型进行深度监督。我们的简单模型生成了视觉上理想的输出,并在MPI-Sintel数据集上显示了相当的性能。其余内容组织如下。文献工作和现有的方法,内在decomposition介绍在第2节。第3节讨论了我们的架构和DenseNet的好处。第4节,分别描述用于训练我们模型的数据集和损失函数。第6节解释了我们如何训练我们的模型,第7节讨论了我们用于评估的错误度量。在第8节中,我们陈述了我们的结果,第9节结束。2. 相关工作Barrow等人(1978)提出了图像内在分解的概念,指出了场景内在特征的必要性。在寻找包含这种内在特征的数据集时,早期的贡献之一是Grosse等人(2009)的MIT数据集,该数据集由分解为朗伯阴影、朗伯反射和镜面反射的真实对象的图像组成。Shen和Yeo(2011)在此数据集上进行了实验,并提出使用反射稀疏先验来分解单个本征图像。将稀疏性约束应用于局部反射率,构造数据驱动的小波表示。然而,由于图像很少且缺乏多样性,MIT数据集不足以用于深度学习方法。Intrinsic Images in the Wild(IIW)是Bell等人(2014)的重要贡献,这是一个由5,230个真实室内图像组成的数据集,具有稀疏反射率注释。稀疏注释是精心制作的,并通过众包获得,这需要基于其注释对每个图像进行复杂的预处理为了找到一种不需要真实世界图像的方法,Narihira等人。(2015)提出了一种基于Eigen等人(2014)的多尺度CNN回归模型,并在计算机生成的合成图像上进行了训练。虽然他们使用MPI-Sintel(Butler等人, 2012),Shi et al. (2017)在他们提出的方法中使用了Sha-peNet数据集中的非朗伯对象。避免传统的基于CNN的方法,Lettry等人。(2018)提出了一种深度生成对抗网络,共同分解阴影和类似地,Baslamisli等人(2018)考虑了基于物理的反射模型,并利用反射率和阴影梯度信息来获得内在图像。回到CNN,Fan等人(2018)设计了一种基于网络的结构,即直接内在网络,指导图和域过滤器。Bi等人(2018)提出了一种混合训练算法和一个更大的双边求解器,以抑制噪声并提高其基于CNN的网络的空间一致性。Yu和Smith(2019)提出了一种深度CNN,通过利用多视图立体监督,在不受控制的条件下从真实世界的图像中学习逆渲染。Liu等人(2019)开发了一种无监督算法,该算法使用自动编码器和生成对抗网络来处理手头的任务。同样,Wang和Lu(2019)探索了从单个输入图像中提取不同本征层的区别特征的作用。他们训练一种用于本征图像分解的双流编码器-解码器网络。Muhammad et al.(2018)提出了一种算法,该算法专注于在分解图像之前去除图像的镜面反射。Kong et al.(2014)使用视频作为输入,通过光流算法预测镜面反射和阴影图像,假设镜面反射在所有帧中都 是 恒 定 的 。 类 似 地 , Li 和 Snavely ( 2018 ) 介 绍 了 BIGTIME(BT),这是一个大型的延时图像序列数据集。使用这个数据集,他们提出了一个模型,该模型从视点固定但光照变化的图像序列中学习内在图像。损失函数的作用以及基于先验知识的过滤在Nestmeyer和Gehler(2017)中被表示为重要组件,以实现端到端学习和平滑的纹理和着色图。Hachama等人(2015年)通过考虑使用从不同视图获得的一个或多个RGB-D图像的能量优化问题,联合估计阴影和阴影图像。Kim 等 人 ( 2016 ) 提 出 了 基 于 CNN 架 构 的 联 合 条 件 随 机 场(JCRF),以从单个输入图像中预测深度图和内在图像。类似地,Yuan et al.(2019)提出了并行CNN来实现这一点。3. 架构我们建筑的主要灵感来自Alhashim和Wonka(2018)。我们建立了一个编码解码器模型,●●●S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报8649×如图2所示,这在许多计算机视觉任务中是实用的。编码器处理原始输入图像以获得低维特征向量,该低维特征向量由解码器上采样回以产生输出。在这项工作中,我们使用一个单一的编码器和两个解码器来产生到输入图像的阴影和阴影映射。编码器产生表示输入RGB图像的维度减少的特征向量,并且在各种可用的架构中,我们使用 DenseNet ( Huang 等人, 2017 )architec- ture,在ImageNet数据集上预训练,作为我们的编码器。预训练有助于减少训练时所需的参数数量来自编码器的结果向量被输入到两个解码器,这两个解码器具有相同的结构和层数。解码器由一系列连续的上采样层组成,这有助于构建其原始大小的渐变和着色贴图。此外,上采样层具有到各种编码器层的残余连接,这允许梯度直接流过网络,而不通过非线性激活函数。生成的渲染和着色贴图有三个通道。为什么选择DenseNet?在可用的各种预训练模型中,我们选择DenseNet来减少可训练参数的数量。在DenseNet中,每个层都从前面的所有层获取输入。在当前层中学习的所有特征图都将作为附加输入发送到未来的层。由于这种隐式的深度监督,存在强大的梯度流,并减少了学习先前特征图的冗余。这些优势在Huang等人(2017)中详细解释。从表1中,我们可以推断,与其他预训练编码器相比,DenseNet需要较少数量的可训练参数。 考虑到这一点,我们选择DenseNet作为编码器。表1不同模型的参数总数编码器参数深度VVG-19144万26ResNet-5025万50ResNet-1010.44亿101InceptionV324万159DenseNet-1218百万121DenseNet-16914万169DenseNet-20120万2014. 使用的数据集MPI-Sintel数据集提供了计算机生成的RGB图像,以及相应的地面实况图像和阴影图。该数据集在许多以前的方法中是突出的,因为它与自然图像相似。它由来自18个场景的890张图像组成,每张图像的分辨率为436x1024。由于这是一个有限的数据集,我们依赖于随机裁剪10320从每个图像中提取320个大小的补丁,以生成8900个图像,如Fan等人(2018)所做。我们使用所有320x320生成的图像进行训练,但为了测试,我们按照Chen和Koltun(2013)的方法分割数据集,从原始的890张图像中获得372张全尺寸测试图像。将获得的测试图像的大小调整为448x1024,并进行归一化以保持像素值在0和1之间。 在数据集中可以很容易地获得目标映射和着色映射,这使得我们可以使用适当的损失函数进行深度监督。图二. 基于编码器-解码器的架构。S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报8650D22i;j;c -kdi:j;cGpWi;j;ci;j;c增强政策。数据增强是正则化的一个众所周知的实现,它在训练过程中应用。它减少了过度拟合,从而导致更好的泛化性能。由于输出的纹理和着色贴图与几何变化无关,因此我们对图像应用水平和垂直翻转变换,概率为0.5.我们不应用任何像颜色通道排列这样的光度量变换,因为模型对每个通道的像素值进行回归。5. 损失函数在接下来的章节中,我们将详细介绍用于我们提出的方法的损失函数及其数学公式。5.1. 标度不变L2损失L2误差是直接监督的常见损失函数。然而,由于固有图像分解中的尺 度 模 糊 性 , 使 用 尺 度 不 变 损 失 函 数 , 如 Narihira 等 人 所 述 。(2015),Eigen等人(2014),并在Eq. (2)其中,其中,yp是预测图像,yg是地面实况图像。我们结合上述损失函数,并将其总结为方程。(六)、我们希望组合损失函数更多地关注图像之间的梯度和相似性,而不是原始像素差异。因此,我们设置来自尺度不变L2损失(Lsi)的较低贡献。对于反照率层:LTotal¼LEdgesLSSIMLReconsL0: 5ωLsi6对于着色层:L总计1/4LSSIM校准品校准品0: 5ωLsi1006. 实现细节模型训练使用Keras框架完成,Tensorflow作为后端,在GoogleColab环境中。使用ADAM优化器,学习率为0.0001,参数值b1=0.9,b2= 0.999,我们使用了8张图像的批次,每个时期大约有1000步这些超参数值是基于以前的方法、实验和微调设置的训练集由来自MPI- Sintel数据集的8900个随机裁剪的图像组成,其中10%用于验证。我们训练了我们的模型15个时期,每个时期大约-迭代持续15分钟。此外,训练样本在每个时期开始时随机洗牌。1X-1X!2在上面的等式中,i和j指的是图像坐标,而c和N是通道索引和像素的总计数,-图像,分别。超参数k被设置为0.5,基于在Eigen et al.(2014)中完成的调谐。该损失函数用于估计最大和着色输出。5.2. 梯度L1损失为了在Rectodo图中获得更清晰的边缘,L1损失在图像的梯度(G)上定义(3):L边y;y1XjG xy;y j jG yy; yj3图3所示的结果说明了每个时期后的损失和准确度变化。在观察这些图之后,我们看到预测阴影图像的验证准确度增加,而预测阴影图像的验证准确度变化。训练后的输出如图4所示。表2列出了最终的损失值和准确度对于模型的定量评估,我们使用Grosse等人(2009)的两个尺度不变误差度量,即MSE和LMSE。尺度不变度量有助于调整每个图像的绝对亮度。所讨论的衡量标准也用于以前的评价方法。pGNpG pGi;j;c尺度不变均方误差(si-MSE):这是标准的MSE,考虑到尺度不变,在上述等式中,Gx和Gy分别代表yp和yg沿x和y分量的图像梯度差。该损失仅用于估计平均值,因为阴影不能被假定为分段常数。5.3. 结构相似性指数(SSIM)损失SSIM是一种常见的图像重建度量,这将有助于我们的核心内在图像模型遵循等式。(一). SSIM损耗在等式中定义。(4)如下:1-SSIM年;年pG使用Eq. (八)、siMSEyg;ypkyg-aypk2=N8其中预测图像yp乘以使误差最小化的标量(α)。该标量是分别为渐变和着色图像计算的。尺度不变局部均方误差(si-LMSE):在Grosse等人(2009)中介绍的LMSE是在重叠的正方形窗口上计算的si-MSE误差的平均值,该窗口的大小为图像沿其较大维度的10%这是一个很好的-LSSIM=yp;yg=25.4. 重构损失ð4Þ与si-MSE相比,粒度测量。siLMSE尺寸:1XsiMSE尺寸:9x重建损失驱动固有的图像分解。正如在许多以前的作品中所做的那样,我们假设输入图像I是其阴影(A)和阴影(S)映射的像素级乘积因此,我们计算原始图像和重建图像上的SSIM损失,其中重建图像是预测的灰度图和阴影图的乘积。如果我们考虑Ip<$Ap<$Sp,则反射损失定义为公式:(五):当量(9)描绘了数学表达式,其中W是窗口的总数,并且wg;wp是分别对应于地面实况和预测图像的窗口。此外,在计算MSE时,针对每个窗口单独计算α8. 结果和讨论在本节中,我们讨论模型推理,并比较其LReconsIg;Ip1-SSIMIg;Ipð5Þ从定性和定量的角度,使用地面实况图像输出。推理在测试集上运行,Lsi dNN2ð2Þ7. 评价S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报8651图三. 两种不同编码器的损耗和精度变化。MPI-Sintel数据集,此外,仅出于视觉比较目的,模型推理在IIW数据集的图像上运行8.1. 定性比较MPI-Sintel数据集如第4节所述获得测试图像,图4提供了地面实况和预测图像的视觉比较。从这些图像中,定性地,可以说,当与真实世界数据集比较时,所提出的模型与合成数据集表现良好。此外,图6给出了我们的模型与现有的固有图像分解方法相比的定性结果。IIW数据集图图5描绘了模型输出与来自IIW数据集的选择性图像上的其对应地面实况的视觉比较。该数据集由在世界上拍摄的真实图像组成,包括室内和室外。在合成图像上训练的网络在这样的真实世界场景上表现不佳(从视觉角度来看)。8.2. 定量比较如表3所示,我们的模型(以蓝色表示)显示了与其他方法相当的性能,这些方法依赖于大量的可训练参数。Q Fan等人提出的模型。由直接内在网络、引导网络S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报8652见图4。MPI-Sintel数据集的输出,用于详细比较。第1行:作为输入图像的两个随机帧。图2- 4:输入图像的地面实况渲染和阴影。图35:从我们提出的模型预测的阴影和阴影。表2损失和准确性(T训练,V验证)。编码器损失精度使用反照率着色反照率着色DenseNet-121不0.16160.131372.6959.93V0.15350.119390.0074.20DenseNet-169不0.14580.122073.1059.53V0.13970.111789.6770.52和域滤波器,导致大量的可训练参数。此外,他们的模型是在多个数据源的联合监督的帮助下训练的,而我们的模型只在MPI-Sintel数据中的320 x320大小的随机补丁集因此,可以推断,我们的模型能够以较少的可训练参数产生有效的输出。包括其他合成数据集将有助于减少表3中获得的误差。S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报8653图五、IIW数据集的输出,用于详细比较。行1:取三个随机室内图像作为输入图像。图2- 4:输入图像的地面实况渲染和阴影图35:从我们提出的模型预测的阴影和阴影。另一点要注意的是,与其阴影图相比,预测的阴影图的质量存在差异。我们计划通过改进Wang和Lu(2019)所做的MPI-Sintel数据集来改进预测的着色图,使得着色层不包含颜色信息。此外,直接从根据等式,Eqdo图或反之亦然将有助于更一致的预测。(1),而不是使用两个单独的解码器单独地预测它们。对于这种方法,首先预测着色图会更好,如Lettry等人的经验所示。(2018)在补充材料中。S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报8654图六、 与Barron和Malik(2014)、Chen和Koltun(2013)、Direct Inrinsics(DI)(Narihira等人, 2015)和RDIID(Fan等人, 2018年)。8.3. 输入图像与重建图像的比较为了进一步评估我们的方法,有必要检查模型满足Eq。(一).为了执行这样的评估,我们首先预测图像的阴影和着色图,然后对输出进行像素级乘积,重建图像比较如图所示。7用于随机测试图像。图 7提供了定性和定量的比较。使用流行的SSIM度量进行输入和重建图像的定量比较。如所观察到的,重建的图像缺乏照明(或阴影效果),S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报8655表3使用MSE和LMSE对Sintel图像分割进行定量评价第二列表示使用的训练集Sintel图像分割训练集反照率si-MSE着色平均反照率硅-LMSE着色平均Retinex(Grosse等人, (2009年)–0.06060.07270.06670.03660.04190.0393Barron和Malik(2014)–0.04200.04360.04280.02980.02640.0281Chen和Koltun(2013)NYU + Sintel0.03070.02770.02920.01850.01900.0188Liu等人(2019年)Sintel(UnS)0.01590.01480.01540.00870.00810.0084DARN(Lettry等人, 2018年)Sintel0.01240.01280.01260.00690.00700.0070DirectIntrinsics(Narihira等人,(2015年)Sintel0.01000.00920.00960.00830.00850.0084Fan等人(2018年)Sintel + MIT0.00690.00590.00640.00440.00420.0043我们的(121)Sintel0.01280.02470.01880.01440.01750.0160我们的(169)Sintel0.01150.02360.01760.01230.01690.0146见图7。来自测试集的输入和重建图像的比较。(For SSIM,值越高意味着图像之间的相似性越大)。到输入图像。然而,重构图像中捕获的颜色与输入图像非常相似所示SSIM值也证实了上述推断。我们可以安全地推断,我们的简单模型能够以最小的错误再现输入图像。因此,我们的方法与核心内在图像模型的基本原理S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报8656见图8。其他结果(使用Densenet-169)。S. Sharan Ranjit和R.K. Jaiswal沙特国王大学学报86579. 结论在这项工作中,我们提出了一个编码器-解码器网络的内在图像分解直接从一个单一的RGB图像。在深度监督和迁移学习的帮助下,我们减少了表示每个特征所需的参数数量,从而减少了训练网络所需的机器数量。预训练的DenseNet有助于有效地减少可训练参数的数量,我们在方法中利用了这一点。对于未来的工作,计划包括真实图像和合成图像,以帮助将模型推广到任何图像。对于真实世界的图像,一些突出的数据集是IIW和MIT数据集。我们计划在使用合成数据进行预训练后,使用这些真实数据集来微调我们的模型。另一个重要的大规模合成数据集是CGIntrinsics(Li和Snavely,2018),它利用基于物理的渲染生成超过20,000张室内场景图像。使用这一点将解释更复杂的结构和照明,这不能从动画MPI-Sintel数据集获得。我们还计划使用一个单一的解码器,而不是目前提出的两个单独的解码器。在诸如MPI-Sintel之类的小数据集的情况下,我们可以基于类似地使用有限大小数据集的医学图像分割任务来微调我们的方法(Jiang等人, 2018年)。我们的方法的更多结果在附录中给出竞争利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作。附录A图图8展示了MPI-Sintel和IIW数据集上的一些其他结果。从这些图像中,我们可以推断出我们的模型预测了视觉上理想的阴影和阴影图。顶部图像来自MPI-Sintel(合成)数据集,而底部图像来自IIW(真实世界)数据集。引用阿尔哈希姆岛Wonka,P.,2018.通过迁移学习的高质量单目深度估计。arXiv预印本arXiv:1812.11941。巴伦,J.T.,Malik,J.,2014.形状、照明和阴影反射。IEEETrans. 模式肛门。马赫内特尔37(8),1670-1687。巴罗,H.,Tenenbaum,J.,Hanson,A.,Riseman,E.,1978.恢复固有场景特征。Comput. 目视系统 2(3 -26),2.Baslamisli,A.S.,Le,H.A.,Gevers,T.,2018.基于CNN的学习使用反射和retinex模型进行内在图像分解。在:IEEE计算机视觉和模式识别会议论文集,pp。 6674-6683。Bell , S. , 巴 拉 , K. , Snavely , N. , 2014 年 。 在 野 外 的 内 在 形 象 ACM Trans.Graphics33(4),159.Bi,S.,Kalantari,N.K.,Ramamoorthi河,2018.用于内在分解的深度混合实数和合成训练。arXiv预印本arXiv:1807.11226。巴特勒,DJ,Wulff,J.,斯坦利,G.B.,布莱克,M.J.,2012年。 一个用于光流评估的自然主义开源电影。在:欧洲计算机视觉会议。施普林格,柏林,海德堡,pp.611-625陈昆,Koltun,V.,2013.一个简单的模型,用于具有深度线索的内在图像分解。在:IEEE计算机视觉国际会议论文集,pp。 241- 248Eigen,D.,Puhrsch,C.,弗格斯河,巴西-地2014年。使用多尺度深度网络从单个图像进行深度图预测在神经信息处理系统的进展2366-2374)。Fan,Q.,杨杰,华,G.,陈伯,Wipf,D.,2018.重新审视深层内在图像分解。在:IEEE计算机视觉和模式识别会议论文集,pp。 8944-8952。Grigorev,A.,田志Rho,S.,Xiong,J.,Liu,S.,蒋飞,2019.无人机图像中的深度人物再识别。EURASIP J.Adv. 信号处理。 2019(1),1-10.格罗斯河,巴西-地约翰逊,M.K.,Adelson,E.H.,弗里曼,W. T.,2009.固有图像算法的地面实况数据集和基线评估。2009年IEEE第12届计算机视觉国际会议。IEEE,pp.2335- 2342Hachama,M.,Ghanem,B.,Wonka,P.,2015.从RGB-D图像的内在场景分解。在:IEEE计算机视觉国际会议论文集,pp。 810- 818黄,G.,刘志,范德马滕湖,Weinberger,K.Q.,2017.密集连接的卷积网络。在:IEEE计算机视觉和模式识别会议论文集,pp。 4700- 4708蒋飞,Grigorev,A.,Rho,S.,田志傅,Y.,Jifara,W.,Liu,S.,2018年基于深度学习的医学图像语义分割。神经元计算Appl.29(5),1257-1265中所述。Kim,S.,帕克,K.,Sohn,K.,林,S.,2016.通过联合卷积神经场从单个图像进行统一的深度预测和固有图像分解。在:欧洲计算机视觉会议。Springer,Cham,pp. 143-159。香港,N.,盖勒,P.V.,布莱克,M.J.,2014.内在视频。参加:欧洲计算机视觉会议。Springer,Cham,pp. 360- 375莱特里湖,Vanhoey,K.,凡古尔湖,2018. DARN:一个用于内在图像分解的深度对抗残差网络。2018年IEEE计算机视觉应用冬季会议(WACV)1359-1367)。Li,Z.,Snavely,N.,2018年Cgintrinsics:通过基于物理的渲染更好地分解图像在:欧洲计算机视觉会议(ECCV)的会议记录(pp. 371-387)。Li,Z.,Snavely,N.,2018.从观察世界中学习内在图像分解。在:IEEE计算机视觉和模式识别会议论文集,pp。 9039- 9048Liu,Y.,李,Y.,你S卢,F.,2019.无监督学习用于从单个图像分解本征图像。arXiv预印本arXiv:1911.09930。Muhammad,S.,Dailey,M.N.,佐藤岛Majeed,M.F.,2018.内在图像分解中的镜面反射处理。在:国际会议图像分析和识别。Springer,Cham,pp. 第 107-115页。Narihira,T.,迈尔,M.,Yu,S.X.,2015.直接内函数:通过卷积回归学习隐式阴影分解。在:IEEE计算机视觉国际会议论文集。2992-2992年。Nestmeyer,T.,盖勒,P.V.,2017.反射自适应滤波改善了固有图像估计。在:IEEE计算机视觉和模式识别会议论文集,pp。 6789- 6798沈,L.,Yeo,C.,2011.使用局部和全局反射率稀疏表示的In:CVPR 2011(pp.697-704)。美国电气与电子工程师协会。施,J.,董,Y.,苏,H.,Yu,S.X.,2017.在shapenet类别中学习非朗伯对象内部函数。在:IEEE计算机视觉和模式识别会议论文集,pp。 1685-1694年。施伟,Liu,S.,蒋飞,赵,D.,田志2018. 用于单图像超分辨率的锚定邻域深度网络。EURASIP J.图像视频处理。2018(1),1-12。王志,卢,F.,2019.基于鉴别特征编码的单图像本征分解。在:IEEE计算机视觉研讨会国际会议论文集(pp. 0-0)。Yu,Y.,史密斯,WA,2019. InverseRenderNet:学习单张图像的逆渲染。在:IEEE计算机视觉和模式识别会议论文集,pp。 3155-3164。Yuan,Y.,Sheng,B.,Li,P.,比湖,金,J.,Wu,E.,2019.使用联合并行学习的深度本征图像分解。 计算机图形学国际会议。Springer,Cham,pp. 336-341。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 构建基于Django和Stripe的SaaS应用教程
- Symfony2框架打造的RESTful问答系统icare-server
- 蓝桥杯Python试题解析与答案题库
- Go语言实现NWA到WAV文件格式转换工具
- 基于Django的医患管理系统应用
- Jenkins工作流插件开发指南:支持Workflow Python模块
- Java红酒网站项目源码解析与系统开源介绍
- Underworld Exporter资产定义文件详解
- Java版Crash Bandicoot资源库:逆向工程与源码分享
- Spring Boot Starter 自动IP计数功能实现指南
- 我的世界牛顿物理学模组深入解析
- STM32单片机工程创建详解与模板应用
- GDG堪萨斯城代码实验室:离子与火力基地示例应用
- Android Capstone项目:实现Potlatch服务器与OAuth2.0认证
- Cbit类:简化计算封装与异步任务处理
- Java8兼容的FullContact API Java客户端库介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功