2017年CS231n课程5:卷积神经网络介绍与历史

需积分: 10 2 下载量 123 浏览量 更新于2024-07-19 收藏 10.38MB PDF 举报
本资源是一份名为"cs231n_2017_lecture5.pdf"的文档,主要聚焦于深度学习中的一个重要概念——卷积神经网络(Convolutional Neural Networks, CNN)。课程由Fei-Fei Li、Justin Johnson和Serena Yeung教授,于2017年4月18日进行。讲座涵盖了以下几个关键主题: 1. 讲座大纲:本次讲座是课程系列的一部分,强调了从线性得分函数(如两层神经网络)过渡到更复杂的CNN结构。讲师提醒学生,第一周作业(Assignment1)将于4月20日截止,并预告了即将发布的第二项作业(Assignment2)。 2. 线性得分函数:讲解了基于两层神经网络的线性得分函数,涉及输入特征x通过权重矩阵W1映射到隐藏层h,然后通过另一层权重W2进行分类,输出10个类别的预测结果。这一部分突出了神经网络的基本结构。 3. 卷积神经网络介绍:讲座的重点转向了卷积神经网络,这是一种特别设计用于处理图像和视频数据的神经网络架构。它利用局部连接性和权值共享,能够有效地捕获空间上的特征,对于计算机视觉任务具有显著优势。课程引用了LeCun等人在1998年的工作,这是CNN发展历史上的一个重要里程碑。 4. 历史回顾:讲师提到了Frank Rosenblatt在1957年开发的感知器(Perceptron),这是最早的神经网络形式之一,主要用于二分类问题。这个早期的机器通过20×20的光敏单元捕捉图像,尝试识别字母,标志着神经网络研究的开端。 5. 图像示例与许可信息:讲座中包含了一张由Rocky Acosta创作的图片,展示了感知器的工作原理,该图像是根据Creative Commons BY 3.0许可使用的。这有助于学生更好地理解感知器与现代CNN之间的联系。 这份资源深入探讨了从基础的神经网络模型到卷积神经网络的转变,以及它们在图像识别领域的应用。通过这些内容,学生可以了解到深度学习在计算机视觉中的核心作用和历史演变。同时,它还提供了实际的作业任务,让学生能够在实践中巩固所学知识。