山世光：解析视觉计算新进展，探索AI的ABCDE

需积分: 10 91 浏览量更新于2024-07-19 收藏 9.95MB DOCX 举报

"山世光的演讲内容主要涵盖了计算机视觉、人脸识别、人工智能、深度学习和神经网络等主题，从视觉计算的最新进展出发，探讨了AI的ABCDE，即基础（A）、基础理论（B）、计算（C）、数据（D）和环境（E）。" 在山世光的分享中，他首先指出人工智能领域的发展变化，过去计算机视觉作为一个独立的研究领域，而现在它被视为人工智能的重要组成部分。计算机视觉的目标是使机器具备类似人类的视觉感知能力，通过分析图像和视频数据来理解周围环境。视觉智能的基础在于图像处理，数字图像由像素组成，每个像素包含红绿蓝三种颜色分量。计算机视觉的任务是从这些像素矩阵中提取关键信息，例如边缘、区域、事件和含义。这涉及到图像分析的多个层次，包括低级特征（如边缘检测）和高级特征（如物体识别）。山世光还深入解释了人类视觉的工作机制，将“看”和“见”区分开来。眼睛的视网膜承担着“看”的角色，通过感光细胞捕获光线信息，而“见”则涉及大脑的处理，包括what通路和where通路，分别对应物体识别和位置感知。大脑中的视皮层和其他相关脑区协同工作，形成复杂的神经网络，以理解图像内容。在讨论到人工智能的未来发展时，山世光可能提到了当前流行的深度学习技术，它模拟了人脑神经网络的架构，通过大量数据训练模型，提高计算机在图像识别、语音识别等方面的性能。深度学习依赖于大数据集，以及高效的计算资源，这正是AI的CDE部分——计算能力、数据量和运行环境。通过这些基础理论和技术的结合，计算机视觉在人脸识别、自动驾驶、医疗影像分析等领域取得了显著进展。然而，山世光可能也提出了疑问，现有的技术是否足以应对人工智能未来的挑战，比如如何实现更智能的决策、理解和适应复杂环境。山世光的分享揭示了计算机视觉和人工智能领域的前沿动态，强调了基础理论、计算能力、数据质量和环境优化在推动技术发展中的关键作用。他的讲解不仅提供了专业知识，也为听众展示了人工智能研究的广阔前景和潜在问题。

通过这样一种方式，我们得到一个多层神经网络，把数据矩阵输入到网络处

理以

后得到我们期望得到的结果，这一过程，也就是我们所谓的“黑盒子”深

度学习。

而在计算机视觉领域，最典型的深度学习方法就是卷积神经网络。2012 年，卷

积神经网络在计算机视觉领域的众多问题上都取得了非常好的效果，其设计非

常符合刚才我讲的层级提取过程。上图给出了卷积神经网络的结构，其过程包括：

卷积、采样、非线性激活、卷积、下采样、以及全连接。其中，卷积其实就是加权

求和的过程，而在任意两层每一个神经细胞之间都有一个全连接的过程。

剩余54页未读，继续阅读

Swailing

粉丝: 2
资源: 12

山世光：解析视觉计算新进展，探索AI的ABCDE

中科创达嵌入式AI介绍

ABCDE*? = EDCBA关于这个的优化算法

人工智能研究进展

A01_AI之ABCDE_山世光_V2

开源SeetaFace，中科院计算所山世光先生团队开发

中科院山世光老师开源的Seetaface人脸识别引擎.jpg

山世光 中科院人脸PDF

山世光人脸识别PPT

中科院(国科大)黄庆明模式识别与机器学习2017-2018试卷(兰艳艳、郭嘉丰、山世光).doc

中科院山世光老师开源的Seetaface人脸识别引擎SeetaFacesTest.rar

最新资源

山世光中科院人脸PDF