机器视觉:从人工特征到深度学习的探索

需积分: 10 2 下载量 116 浏览量 更新于2024-07-09 收藏 10.38MB PPTX 举报
"《机器视觉》郑东强_第1章_概述5.16.pptx" 机器视觉,作为人工智能领域的一个重要分支,是指通过机器模拟人类视觉感知能力来获取、处理、分析图像信息,并根据这些信息进行决策或控制的技术。机器视觉的优势在于其能够利用多种感知手段,如可见光、激光3D、红外、热成像、超声波以及雷达等,超越人类视觉的局限,实现24小时不间断工作,尤其在极端环境或精确测量方面具有显著优势。 图像数据的本质由时间(t)、空间坐标(xyz)和像素值(v)组成,通常以离散形式存在。图像信息的特点是位置相关性,即图像中的每个像素都与其周围像素有着紧密的联系。这种特性使得视觉问题可以被建模为数学问题,通过人工特征定义和多层神经网络提取来解决问题。人工特征提取包括滤波、形态学操作、图像分割、二值化、特征提取和特征匹配等步骤,而随着深度学习的发展,尤其是卷积神经网络(CNN)的出现,机器视觉领域的特征表示和学习方式发生了革命性的变化。 第1章《机器视觉概述》涵盖了以下几个关键点: 1. 人工智能与机器视觉:机器视觉是AI的重要组成部分,它涉及样本(x,y)的训练和测试,通过模型f找到最小化预测误差的方法。 2. 人工特征与深度学习特征:传统机器视觉依赖于人工设计的特征,如颜色、纹理、面积、形状和结构;而深度学习则自动学习特征,尤其是通过CNN,能够从原始图像数据中学习高层表示。 3. 国内外机器视觉系统的现状:机器视觉广泛应用在电子、汽车、冶金等多个行业,电子制造业占比最高,且呈现出向末端全闭环控制发展的趋势。 4. 全球机器视觉市场分析预测:随着5G、大数据和GPU技术的发展,机器视觉市场持续增长,深度学习的引入推动了其进一步发展。 5. 机器视觉的主要应用方式:包括图像分割、激光3D成像、红外热成像、超声波成像等多种方式,广泛应用于生产生活的各个领域。 机器视觉的发展受益于深度学习的爆发,自2012年Hinton课题组的AlexNet在ImageNet比赛中取得突破以来,深度学习已成为机器视觉的核心技术。特征定义、提取和分类的三位一体,以及CNN的广泛应用,极大地提高了机器视觉的性能和效率,使其在模式识别、目标检测、自动驾驶等领域发挥着重要作用。