解析深度学习黑盒：CNN卷积层工作原理与设计揭秘

16 浏览量更新于2024-08-30 收藏 2.37MB PDF 举报

本文是机器学习系列中的第12部分，专门讲解卷积神经网络（Convolutional Neural Network, CNN）的第二部分。在深度学习领域，由于模型复杂性高，许多人将CNN比喻为“黑盒子”，因为它在处理图像和数据时的内部工作原理不易直观理解。文章针对三个核心问题进行探讨： 1. **理解CNN的工作机制（What does CNN do?）**：作者首先强调，尽管CNN可能看起来像是个黑盒，但可以通过特定方式去分析。第一层的卷积核（filter）相对直观，每个3x3的滤波器对应于图像中的9个像素，可以直接观察其权重来理解它检测的特征。 2. **为何选择CNN（Why CNN?）**：文章提到，CNN之所以被选择，是因为它能够自动提取输入数据中的特征，并且对空间关系敏感。它在视觉任务中表现出色，如图像分类和识别。然而，为了保持“智能”（intelligence），CNN的深层次结构和抽象特征使得其决策过程难以完全理解，这正是其“黑盒”特性的一部分。 3. **设计CNN的策略（How to design CNN?）**：设计CNN时，需要考虑层数、滤波器数量、大小以及池化操作等因素。对于深层滤波器，它们处理的是经过前一层卷积和池化的特征图，这使得它们的解释更为复杂，因为每个滤波器看到的特征区域远大于单个像素。 4. **分析CNN的学习内容（What does CNN learn?）**：要理解深层滤波器的功能，可以通过观察它们输出的特征图来间接推断。例如，通过查看第k个滤波器输出的11x11矩阵，可以尝试理解它在图像中的响应模式，尽管具体功能可能不易直接解读。本文旨在打破CNN的神秘感，提供一些基本的分析方法，帮助读者理解即使是最深层次的滤波器，也并非完全不可捉摸。通过这种分析，虽然不能完全揭示CNN的所有决策逻辑，但至少可以让我们对模型的部分运作有更深入的认识。

上图就是得到的结果，50个filter理论上可以分别找50张image使对应的activation最大，这里仅挑选了其中的12张image作为展示，这些image有一个共同的特征，它们里面都是一

些反复出现的某种反复出现的某种texture(纹路纹路)，比如说第三张image上布满了小小的斜条纹，这意味着第三个filter的工作就是detect图上有没有斜条纹，要知道现在每个filter检测的都只是图上一个

小小的范围而已，所以图中一旦出现一个小小的斜条纹，这个filter就会被activate，相应的output也会比较大，所以如果整张image上布满这种斜条纹的话，这个时候它会最兴

奋，filter的activation程度是最大的，相应的output值也会达到最大

因此每个filter的工作就是去detect某一种pattern，detect某一种线条，上图所示的filter所detect的就是不同角度的线条，所以今天input有不同线条的话，某一个filter会去找到让它兴奋

度最高的匹配对象，这个时候它的output就是最大的

what does neuron do

我们做完convolution和max pooling之后，会将结果用Flatten展开，然后丢到Fully connected的neural network里面去，之前已经搞清楚了filter是做什么的，那我们也想要知道在这个

neural network里的每一个neuron是做什么的，所以就对刚才的做法如法炮制

剩余12页未读，继续阅读

weixin_38537050

粉丝: 7
资源: 954

解析深度学习黑盒：CNN卷积层工作原理与设计揭秘

头歌计算机网络实验部分答案

机器学习算法-神经网络LSTM

机器学习系列11-卷积神经网络CNN part1

深度学习入门：卷积神经网络CNN基础解析

机器学习学习笔记-英文版

基于多任务学习及由粗到精的卷积神经网络人群计数模型.pdf

融合词性和注意力的卷积神经网络对象级情感分类方法.pdf

《TensorFlow2.0》一、机器学习和深度学习简介及基础编程 part 2

哈尔滨工业大学-人工智能课件part2

机器学习实验二Part one数据集和训练出的模型文件.rar

最新资源