卷积神经网络对视觉错觉有欺骗性（中文标题）

21 浏览量更新于2023-10-19 收藏 1.86MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

12309卷积神经网络可以被视觉错觉欺骗A. Gomez-Villa，A. Mart'ınJ. Vazquez-Corral，M. 贝尔塔尔姆奥山{alexander.gomez，adrian.martin，marcelo.bertalmio}@ upf.edu，j. uea.ac.uk摘要视觉错觉告诉我们，我们所看到的并不总是在物理世界中所代表它们的特殊性质使它们成为测试和验证任何新的视觉模型总的来说，当前的愿景模式-视错觉目标诱导物ELS基于线性和非线性操作的级联这种结构与卷积神经网络（CNN）中存在的操作的相似性促使我们研究为低级别视觉任务训练的CNN是否会被视觉错觉所欺骗特别是，我们证明了针对图像去噪、图像去模糊和计算颜色恒定性训练的CNN这些结果表明，为了获得更好地复制人类行为的CNN，我们可能需要开始让它们更好地复制视觉错觉。1. 介绍视错觉是人类视觉系统复杂性的迷人例子，也是感知与现实之间内在差异的迷人例子：虽然我们不断地假设我们所看到的是我们周围世界的忠实再现，但视觉错觉清楚地表明，我们所看到的只是眼睛和大脑的内部构造，因为我们的内部再现和世界本身往往不匹配。例如图图1显示了一个简单的颜色错觉，三只相同的猫被视为具有完全不同的颜色，这取决于它们周围的环境。视觉错觉是如此惊人，因为即使我们去检查这三只猫确实有相同的三重RGB值，因此向我们发送相同的光，我们仍然看到它们有不同的颜色。除了基于颜色的错觉之外，还有许多类型的错觉，涉及其他感知，如亮度，运动，几何，图1.一个简单的颜色视错觉的解剖。虽然目标（猫）总是相同的，在三种情况下具有相同的RGB三元组，但当它被隔离时，我们将其视为“一个人，一个人。对于视觉科学界来说，视错觉的研究是关键[2，3]，因为现实和感知之间的不匹配提供了非常有用的见解，可以开发新的感知或神经活动的视觉模型[4]，也可以验证现有的模型。这仍然是一个非常具有挑战性的开放问题，正如各种视觉科学模型（例如，基于边缘整合、完形锚定、空间过滤、内在图像或纯经验的视觉模型），以及它们中没有一个能够复制广泛的视觉错觉的事实;即使是能够成功预测错觉的模型，也可能在引入轻微修改（如添加噪声）时失败[5]。视觉科学中一种非常流行的方法是将神经活动和感知建模为级联模块，每个模块由线性卷积运算和非线性运算组成，参见[6]及其参考文献1。这些当然是卷积神经网络（CNN）的构建模块，但是虽然视觉模型中的过滤器被设计为使模型最好地复制神经或感知数据，但CNN中的过滤器以监督的方式学习，以便执行特定的成像任务，例如分类，识别或去噪，仅举几例。作者发现相当惊人的是，鉴于视觉错觉对视觉科学界的重要性，CNN的神经灵感，以及CNN的目的往往是复制人类行为，几乎没有将视觉错觉和CNN联系起来的工作。到信息和通信技术部（贸发会议），庞培法布拉大学C. Roc Boronat 138，08018，Barcelona（巴塞罗那），西班牙†CMP，University of East Anglia，NR4 7TJ，Norwich，UK1我们想强调的是，线性+非线性级联非常常见，但绝对不是视觉科学中建模的唯一方法，因为它们具有众所周知的局限性[7]。12310据我们所知，在这方面仅有两个最近的出版物。第一个来自视觉科学领域[8]，在那里，经过训练的CNN预测视频能够再现运动错觉。在第二篇文章中，作者从计算机视觉的角度[9]，分类并尝试使用生成对抗网络生成新的视错觉。在本文中，我们报告了一个我们认为非常值得注意和令人惊讶的发现，即在自然图像数据库上训练的用于基本低级视觉任务的CNN再现了人类对某些视错觉图像的反应，即。CNN被视觉错觉所欺骗，就像我们被它们欺骗一样。我们的另一个主要贡献是研究这些CNN复制视觉错觉的能力如何受到常见的架构变化和空间模式大小的影响。我们相信，这些结果对视觉科学和计算机视觉都有重要的影响。对于视觉科学界，他们支持这样的观点，即为了执行低水平视觉任务，人类视觉系统执行作为副产品产生视觉幻觉的操作。此外，这些发现可以帮助视觉科学发展一种分类，即视错觉与视觉任务相关。对于计算机科学界来说，这些结果在CNN和视觉系统之间建立了一座新的桥梁。然而，正如我们的实验所示，这种关系及其可能的后果受到这样一个事实的限制，即并非所有的视错觉都能被这里研究的CNN复制。这可以揭示CNN模仿视觉系统的局限性，因此为设计新架构提供了机会，通过更好地复制视觉错觉，可以表现得更像人类。2. 方法2.1. 人类视觉感知让我们从解释视觉科学如何测量模型在特定场景中复制视觉感知的能力开始。观察者首先评估他们对刺激的某些方面的理解（例如，亮度）以可量化的方式（例如，通过将其按从0到5的等级进行排序）。然后，对受试者的反应进行平均，并将这些平均值与模型产生的输出值进行比较。最后的比较可以定性或定量地进行。在本文中，我们将遵循定性范式。如果输入图像的值与CNN产生的输出值之间的差异在性质上与人类感知一致，则我们说CNN复制VI这是，例如，如果我们认为中间灰度级是较暗的灰色，而CNN将中间灰度输入值转换为更接近黑色的输出值。2.2. 视错觉在亮度和颜色视错觉中有两种相互对立的基本效应，即同化和对比。在同化效应的情况下，图像值向邻近区域的图像值改变相反，在对比度效果的情况下，图像值远离相邻区域的图像值。我们选择两个同化VI（图。2 a 2 b），一个对比度VI（图。2 d），和两个非定义（非同化，也不是对比）的VI（图。2c和2e）。图3中的第一行显示了相同VI的彩色版本。错觉2a-d呈现的目标具有相同的价值，但根据其周围的情况而被不同地看到。目标是，在地下城幻觉（[10]，图2a）中，大的中心广场，在Hong-Shevell（[11]，图2b）中，中间的环，在白色幻觉（[12]，图2c）中，小的灰色条，以及亮度梯度（Lum.）幻觉（[13，14]的组合，图2d）的圆圈。事实上，这些目标确实具有相同的值（在所有情况下都是0.5），可以在图2的第二行中看到。2，其沿着在顶行中的视觉错觉上以颜色示出的段绘制图像值。谢弗勒尔错觉[15]从左到右呈现强度增加的均匀带，但这些带被感知为不均匀的，在相邻带之间的边界处具有较暗和较亮的线。在彩色版本（图中的第一行）中，3）、现象相似：对于地牢和Hong-Shevell的情况，右目标必须朝向绿色，左目标朝向红色;对于白色幻觉，左目标必须朝向黄色，右目标朝向红色;在亮度梯度幻觉中，左目标应该朝向红色，右目标朝向绿色;最后，类似于灰度情况，在红色通道中应该感知到Chevreul错觉。2.3. 低水平视觉任务研究在这项工作中，我们考虑了三个关键的图像处理问题，这些问题与人类感知密切相关：去噪涉及我们对图像中的噪声进行折扣的能力[16]，去模糊涉及我们避免感知由移动物体引起的模糊的能力[17]，以及颜色恒定性涉及我们对颜色的感知与物体的反射特性相当好地匹配的方式，而与光源的颜色无关。2.4. CNN架构对于我们的核心实验，我们为CNN选择了一个非常简单的架构：大小为128×128×3像素的输入和输出层，一个具有8个特征图的隐藏层，其感受野（内核大小）为5，没有步幅（步幅1），以及sigmoid激活函数。最后有一个卷积层作为输出层（因此它有三个层用于红色，绿色和蓝色通道）。12311图2.第一行显示选定的灰度视错觉，如第2节所述。图中错觉的比例与实验中用于展示目的的比例不同。洋红色和青色线表示在行2-4中绘制的轮廓在图像中的位置。请注意，没有池化、剩余连接或其他修改被添加到该架构中。均方误差在所有任务中用作损失函数，所有模型都使用Keras [18]实现。我们根据它们接受训练的任务来命名CNN。因此，DN-NET、CC-NET和DB-NET分别对应于去噪、颜色恒定性和去模糊然后，我们转向Jain等人提出的类似CNN。[19]，第一个成功的CNN设计用于图像去噪。我们对这个CNN的实现，从现在开始我们将其命名为Jain 2009，其输入/输出大小为128×128，由四个隐藏层组成，内核大小为5，激活函数为sigmoid。这个CNN可以被认为是第一个实验的CNN的更深版本我们使用这种CNN来研究CNN结构的常见变化以及它们如何影响VI的复制。最后，我们使用最近的 CNN 进行去噪（ Zhang2017）2源代码可在以下网址公开获取：https://github.com/alviur/convnets_vs_vi[20]测试对更复杂架构的响应。2.5. 数据集对于去噪，我们考虑了大规模视觉识别挑战2014年CLS-OCT验证数据集[21]（包含50 k图像），并在将图像大小调整为128 x128后使用σ= 25对于去模糊，我们考虑相同的数据集如前所述，并使用σ= 2的高斯核模糊图像。对于颜色恒定性，我们考虑Cheng等人的数据集。[22]为每个图像提供照明的颜色。我们通过将光源颜色的逆应用于原始图像来计算地面实况图像，然后我们在原始图像和地面实况图像之间执行端到端训练。对于这个问题，我们将每个原始图像分成四个子图像，以增加网络训练通过这样做，我们最终得到了总共6944张图像。在这三种情况下，数据集被分为70%用于训练，20%用于验证，10%用于测试。12312图3.第一行显示所选的颜色视错觉，如第2节所述。图中错觉的比例与实验中用于展示目的的比例不同。黑色实线和虚线表示在行2-4中绘制的轮廓在图像中的位置。仅显示红色和绿色通道的配置文件。2.6. 实验固定了5个VI中每个VI的基本空间尺度，以评价重复性。该基本比例为4x4像素（px.）地下城的目标方格，1像素。Hong-Shevell的环宽，4x 4 px。白色目标，5像素。亮度梯度的直径目标（Lum.）10 px。步长为Chevreul。感受野的相应基础大小（稍后也称为核大小）被选择为5x5。在人类中，存在观察到的关系（参见例如，[1]页）空间频率和视觉效果之间的关系。在大多数情况下，这种关系表明，较高的频率意味着所观察到的目标之间的这种关系使我们研究了空间尺度在虚拟仪器复制中的作用。为此，我们合理地假设了感受野和图案的空间频率之间的关系。根据这个假设，我们将错觉的规模增加到基础规模的3、4和6倍。在核大小的情况下，我们还测试了12313表1.进行的实验总结标签CNN视觉错觉错觉内核大小图E1DN-NET、CC-NET、DB-NET全套灰度基地52E2DN-NET、CC-NET、DB-NET全套颜色基地53E3aDN-NETG/RGB Dun. &卢姆{1，1. 一，一。二一3}×基础54a，bE3bDN-NETG/RGB Dun. &卢姆{1，1. 一，一。二一3}×基础三、五、七、十一、十五4CE4aJain2009G/RGB Dun. &卢姆基地55E4b2009年1月+合并G/RGB Dun. &卢姆{1，1. 一，一。二一3}×基础三、五、七、十一、十五6aE4cJain2009+扩张卷积G/RGB Dun. &卢姆{1，1. 一，一。二一3}×基础三、五、七、十一、十五6BE4d2009年1月+剩余连接G/RGB Dun. &卢姆{1，1. 一，一。二一3}×基础三、五、七、十一、十五6个cE5Zhang2017G/RGB Dun. &卢姆基地573x3、5x5、7x7、11x11和15x15。前两个实验包括评估DN-NET，CC-NET和DB-NET的复制时，呈现所有选定的灰度（E1）和颜色（E2）的基本尺度和内核大小的视错觉。本文中的进一步实验仅限于Dungeon和Lum的彩色和灰度版本。错觉，分别代表同化和对比的相反效果在实验三中，我们研究了DN-NET在空间尺度和核大小与基本情况不同时的复制。首先，在固定内核大小的情况下，我们改变错觉其次，我们修改了错觉的规模和感受野（E3b）的大小。后来我们转移到更深层次的CNN（Jain2009），并测试了其基本尺度和内核大小（E4a）的复制。然后，在同一个实验中，我们分别测试了错觉和感受野的所有尺度和大小。接下来，我们研究了Jain2009 CNN的三种不同变体。首先，在第一和第二卷积层之后分别添加两个池化层为了恢复输入的原始尺度，在最后两个隐藏卷积层中的每一个测试了2、4和8的合并量（E4b）。第二个变化是用膨胀率为2、4和8的卷积层（E4c）替换Jain2009的标准卷积层。最后一项测试包括尝试使用剩余连接（E4d）的Jain 2009的几种配置。最后一个实验研究了用于去噪的最先进CNN的复制， Zhang 2017 。它被测试为基础规模的幻想（E5）。上述所有实验的总结见表1。最后，我们提出了一个问题，如果简单的图像处理算法也可以解释VI现象。在特别地，我们研究了经典的对比度增强（CLAHE[23]）和经典的去噪（全变差去噪[24]）是否可以再现同化和对比度。3. 结果由于大量的实验和难以显示其结果，在本文中，我们将集中在一些选定的情况下。尽管如此，我们所选择的案例代表了我们所提出的实验中发现的主要效应和趋势。我们邀请读者看看我们的灵活的材料，为全套实验。我们将我们的结果作为CNN输出的配置文件。配置文件是输出图像中一行对于每个VI，绘制的行用VI上的颜色段指示。例如，在图。2输入轮廓（第二行）是VI（第一行）中标记区域（如洋红色或青色）的轮廓。这种结果的定性表示在视觉科学中很常见[2]。图中所示的对应于灰度错觉的输出轮廓是使用公式0获得的灰度值。2989 R + 0。5870 G + 0。1140B，其中R、G和B是红色、绿色和蓝色通道中的对应值。在本文的所有结果（输出曲线）中，VI输入在将其馈送到CNN之前没有被噪声污染或模糊使用污染输入的其他实验（由于篇幅限制未显示）导致类似的复制效果。3.1. 灰度VI的复制（E1）图图2显示了实验E1的结果我们可以看到，DN-NET能够复制从（a）到（b）的错觉。(d)（请参见输出配置文件行：图2中的DN-NET）。虽然Dungeon（a）和H.S.（b）复制得很好，白色(c)和Lum。(d)效果不太明显。CC-NET复制从（b）到（d）的错觉（参见输出配置文件：CC-NET12314图4.同化导致DN-NET对低频和高频灰度和彩色视觉错觉的影响（图2），但产生与（a）中人类感知相反的效果。最后，DB-NET从(b)到（e），但呈现与（a）中的CC-NET相同的相反效果然而，DB-NET是唯一一个能够复制灰度（e）中Chevreul错觉的效果。3.2. 彩色VI的复制（E2）在图3中，我们显示了实验E2的结果。DN- NET复制错觉（a）、（b）、（c）和（e）。地下城(a)和高血压。(b)右目标增加其绿色值（w.r.t.）。输入），而左目标在红色通道中增加其值。对于白色（c），通过增加其绿色通道值，左侧目标更接近黄色。在Chevreul（e）的情况下，在红色通道中有轻微的复制。最后，关于Lum。(d)，DN-NET无法重现VI。DB-NET复制除H.S.（b）.对于幻象地牢（a）和白色（c），效果与DN-NET观察到的效果对于Chevreul（e），该效应在红色和绿色通道中均被复制最后在Lum。(d)分别针对左和右目标的红色和绿色通道明显增加，而相对目标中的相同通道相应减少。3.3. VI规模的影响（E3a）DN-NET在图案大小增加时减少了复制误差（增加图案大小相当于降低空间频率），因此模拟了在人类感知中观察到的行为[1]）。然而，效果的减少取决于接收场的大小以及错觉是灰度还是彩色。当移动到等于或大于8个像素的大小时，在灰度的Dun- geon错觉中观察到的DN-NET的复制效果完全丢失（见图中第一行的4）. 然而，同样的VI颜色仍然复制该尺寸的效果，特别是在红色通道（图中第二行的中间列）。4）.在Lum的情况下也观察到相同的演变，但程度较小此外，增加空间频率导致衰减的复制，与人类感知中产生的效果相反。图4a第一行显示了地下城中的同化效果如何在灰度中几乎消失。Lum中的对比度效果也是如此。在颜色的情况下，同化效应仍然明显存在（图。4 a）但不是Lum的对比效果。3.4. 感受野大小（E3b）为了卢姆使用较大的感受野导致复制效果的增加。然而，对于地牢效应，当使用最大的感受野大小（15× 15）时，从4像素的目标大小移动到3像素将同化改变为对比效应（见图2）。4 c）。对于彩色VI，两种错觉都没有显着的质的变化。虽然在感受野和图案的空间频率之间存在关系。从目前的实验中不能直接理解这种关系的性质。在大多数图形频率和感受野大小的组合中3.5. 2009年1月，更深入的架构（E4a）图5显示了Jain 2009的结果。我们发现副本-灰（虽然减少）的灰度两种效果。尽管比DN-NET深四倍，Jain 2009显示了与原始DN-NET类似的结果对于彩色VI的情况，仍然有一个复制的同化效果在地下城，但不是对比效果在亮度。(as是DN-NET的情况，见图。（3）第三章。12315图5. Dungeon和Lum的复制结果。对于Jain2009，基于[19]的架构。图6.当添加大小为2的合并时，从2009年1月选择的结果同化效应仅在颜色中复制，而对比效应在灰度中复制。3.6. 将池化层添加到Jain2009（E4b）当使用池化层时（在这种情况下为2），灰度图像中的副作用是破坏了更高频率的VI。此外，在地牢的情况下，副本丢失，事实上，观察到相反的效果然而，在Lum中仍然存在复制效应。对于更大的目标尺寸（见图）。6 a）。在颜色的情况下，同样的空间模式破坏的效果发生，但复制效果仍然存在于红色和绿色通道的地下城VI。较大的池化大小导致VI中的图案的总体空间破坏，使得防止进一步分析。3.7. 在Jain2009（E4c）当增加扩张卷积时，观察到两个主要效应。第一，Lum的对比效果。对于任何膨胀率，都不会以灰度或彩色进行其次，在所有情况下，当考虑目标等于或大于4像素时，地牢的灰度效果不再复制。事实上，它显示了一种对比效果。然而，在颜色的情况下，即使考虑到更大的目标，地下城VI仍然有复制（见图10）。6b第二行）。只有当使用尺寸为4的扩张时才能观察到特殊情况：副本在Dungeon中以最小图案尺寸的灰度显示（显示在图6b第一行）。对于任何其他尺寸的扩张，情况并非如此。3.8. 2009年1月，带剩余连接（E4d）测试了Jain 2009的几种配置（带有剩余他们共享了取消副本和Lum的效果。在灰度中。然而，具有从第一卷积层的输出到最终输出层的输入的单个残余连接的架构仍然能够复制灰度Dungeon VI中的最高频率的模拟效果（参见图1中的左列）。6 c）。在颜色的情况下，对于所有不同的变化Jain2009与residual连接，有一个副本地牢，即使我们增加了模式的大小（图中的第二行6C）但不是Lum。在所有的案件中。3.9. 最近去噪CNN中的复制（E5）图 7 显示了 Zhang 2017 如何在很小程度上复制Dungeon和Lum中的效果。目视颜色VI也是如此，它的行为方式与DN-NET和Jain 2009相同。3.10. VI和经典图像处理方法可以预期的是，可以使用锐化滤波器或经典的对比度增强算法，如CLAHE [23]。12316图7.Dungeon和Lum的复制结果对于Zhang2017，[20]中提出的用于图像去噪的最先进CNN电视CLAHE10.50洪舍韦尔卢姆10.50林宏雪图8.经典图像处理算法的重复结果。左：全变差去噪。右：克拉赫。能够再现对比度类型的VI，即，使得区域的图像值在与相邻像素的值相反的方向上改变。类似地，简单的平均滤波器或经典的去噪算法（如基于总变差的去噪[24]）可以能够再现同化类型的VI，即，使得一个区域的图像值朝着所述区域的相邻区域的值改变。然而，这些简单的滤波器或经典算法似乎不能同时再现两种类型的错觉，如图3.7所示。TV去噪再现了Hong-Shevell（仿射），但没有再现亮度错觉（对比度），而CLAHE则相反。相比之下，本文介绍的DB-NET和DN-NET CNN能够同时再现这两种错觉。4. 结论在这项工作中，我们表明，在自然图像数据库上训练的CNN用于基本的低层次视觉任务，再现了人类对某些视错觉图像的反应，即：CNN被视觉错觉所欺骗，就像我们被它们欺骗一样。测试了经过去噪、颜色恒定性和去模糊训练的单个隐藏层CNN的版本，以复制五种常见的视觉错觉。更深层次的结构及其常见的修改（如池层，扩张卷积，和残余连接）也进行了探索，以评估其在复制视错觉的效果。结果发现，即使是最简单的具有8个特征图的单个隐藏层也已经能够复制人类对几种灰度和彩色错觉的反应。此外，输入图像或CNN架构的变化会导致网络能够复制的幻觉的变化我们认为，本文中的CNN将视错觉再现为去噪、颜色恒定性或去模糊等低水平视觉任务的副产品尽管有明显的不同，但所有这些任务的生物学相关性都旨在提高表征和视觉处理的效率，因此这支持了以下论点：视觉错觉是我们为了最佳使用而我们视觉系统的有限资源。CNN能够复制的错觉取决于每个CNN正在解决的任务。从视觉科学的角度来看，利用这种洞察力来尝试将特定的错觉（或错觉家族）与视觉处理任务联系起来是很有趣的。另一个有趣的发现是，用彩色图像训练的CNN也可以复制灰度级的视觉错觉：这可能会给出一些线索，以回答从颜色信号导出的亮度感知在视觉系统中的精确位置的问题，这仍然是一个开放的问题。最后，从计算机视觉的角度来看，如果我们想要CNN更好地复制人类行为，我们可能应该开始让它们更好地复制视觉错觉。我们目前正在沿着这条路线工作，开发一个CNN架构，目标是尽可能多地再现视觉错觉，并从心理物理数据中进行验证。作为未来的工作，我们希望评估复制视觉错觉的CNN是否更能抵抗不愚弄人类的对抗性并使用例如生成对抗网络来生成新的视觉错觉。确认这项工作已经收到了欧盟地平线2020计划根据赠款协议761544（项目HDR 4 EU）和赠款协议780470（项目SAUCE）以及西班牙政府和FEDER基金的资助。TIN 2015 -71537-P（MINECO/FEDER，UE）。我们非常感谢 NVIDIA 公司捐赠用于本研究的 Titan XpGPU。12317引用[1] A. G. Shapiro 和 D. Todorovic ， The OxfordCompendium of Visual Illusions.牛津大学出版社，2016年。[2] F. A. Kingdom ， “Lightness ， brightness andtransparency：四分之一个世纪的新思想，迷人的示范和无情的争议，”视觉研究，第51卷，没有。第7页。652[3] J. Yeonan-Kim和M.Bertalm'ıo，“Retinex算法的视网膜和皮质成分分析”，电子成像杂志，第26卷，第117号。3，第031208页，2017年。[4] D. H. Hubel，眼睛，大脑和视觉。美国科学图书馆/美国科学图书，1995年。[5] T. 贝兹R. 沙普利F. A. 威克曼和M. Maertens，15，no. 14，pp. 2015年1月[6] M.马丁内斯-加西亚P.西里尔，T. 巴塔尔，M. Bertalmo和J. Malo，“级联线性+非线性神经模型的导数和逆”，PLOS ONE，第13卷，pp. 2018年10月1日[7] N. V. Graham，“Beyond multiple pattern analyzersmodeled as linear filters （ as classical v1 simplecells ）： Usefuladditionsofthelast25years，”Vision research，vol. 51，no.第13页。1397[8] E. Watanabe，A.北冈湾坂本，M。Yasugi和K.Tanaka，“通过训练用于预测的深度神经网络再现的幻觉运动”，心理学前沿，第9卷，第100页。345，2018年。[9] R. M. Williams和R. V. Yampolskiy，[10] P.Bressan，“Explaininglightnessillusions，”Perception，vol. 30，no.第9页。1031[11] S. W. Hong和S. K. Shevell，“从图案化诱导背景中的亮度对比和同化”，《视觉研究》，第44卷，第2004年。第1页。35-43，2004年。[12] M. 怀特，号8 第4页。413[13] E.布鲁克，“ 优步埃尔甘宗andcontrasfarben，《维也纳历史》第51卷1865年[14] E. H. Adelson，“Lightness Perception and LightnessIllusions，”New Cogn. Neurosci，vol. 339，2000.[15] F. Ratliff ， Mach Bands ： Quantitative Studies onNeural Networks.霍尔登-戴，旧金山，伦敦，1965年。[16] W. McIlhagga，“去噪和对比度恒定性”，《视觉研究》，第 44卷，第100期。第23页。2659 -2666，2004。[17] M. Morgan和S. Benton，385[18] F. Chollet等人，“Keras.”https://keras.io，2015年。[19] V. Jain和S. Seung，769[20] K. Zhang，W.左，Y. Chen，中国粘蝇D. Meng和L.Zhang，“Beyond a gaussian denoiser：用于图像去噪的深度cnn的残差学习”，IEEE Transactions onImage Processing，第26卷，第123期，第123页。第7页。3142-3155，2017。[21] Russakovsky等人，“Imagenet大规模视觉识别挑战”，International Journal of Computer Vision，第115卷，no.第3页。211[22] D. Cheng，D.K. Prasad和M.S. Brown，“用于颜色恒定性的照明估计：为什么空间域方法起作用以及颜色分布的作用，”J.Opt. Soc. Am. A，vol. 31，pp.1049[23] K. Zuiderveld，474[24] L. I. Rudin，S. Osher和E. Fatemi，“基于非线性全变差的噪声去除算法”，Physica D：非线性现象，第 60 卷，第 100 期。 1-4 ， pp. 259-268 ，1992。

下载后可阅读完整内容，剩余1页未读，立即下载