Mean-Shift算法在图像文本信息提取中的应用

4星 · 超过85%的资源需积分: 9 80 浏览量更新于2024-09-18 收藏 311KB PDF 举报

"基于Mean-Shift的图像文本信息提取技术是一种用于从图像中识别和提取文本的方法，由叶茂锹、周武能和朱黎博提出。该技术着重于利用Mean-Shift算法进行图像分割，进而对文本区域进行投影分析以实现字符分割和识别。在图像处理领域，文本信息提取具有广泛应用，如涉外导游、盲人引路、机器人行走和智能监控系统等。图像中的文本分为场景文本和人工文本，两者在检测和识别上均存在挑战，如背景复杂性、颜色多样性、字体变化以及低分辨率导致的字符识别难题。早期的研究始于对路牌、车牌等的文本提取，随着技术进步，现在可以处理更复杂的彩色图像和背景。" Mean-Shift算法是一种无参数的密度估计和目标跟踪方法，适用于图像分割。在图像文本信息提取中，它通过对像素的颜色和空间信息进行迭代聚类，找到高密度区域，从而分割出可能包含文本的区域。Mean-Shift算法的优势在于其无需预先设定类别数量，能够自适应地根据数据分布进行分割。在提取图像文本信息的过程中，首先应用Mean-Shift算法对整个图像进行分割，将图像划分为多个区域。接着，对分割得到的文本区域进行投影分析，这种方法通常涉及沿文本行的方向（例如垂直方向）进行一维投影，通过投影曲线的峰值来确定单个字符的位置，进而将字符分隔开。投影分割法在处理连续的文本行时特别有效，能有效地减少背景噪声的影响。文本识别阶段，通常会采用OCR（Optical Character Recognition，光学字符识别）技术，对分割出来的字符进行识别。OCR技术通过训练模型来学习不同字符的特征，并将图像中的字符映射到相应的文字。近年来，深度学习模型，如卷积神经网络（CNN），在OCR领域取得了显著的进步，提高了字符识别的准确性。针对图像中的文本检测，研究人员不断探索新的方法以应对各种挑战，包括复杂背景的去除、光照变化的处理、字体多样性的适应以及低分辨率字符的识别。这些研究推动了图像处理和计算机视觉领域的进展，使得图像文本信息提取更加智能化和自动化，为实际应用提供了强有力的技术支持。

ＭｉｃｒｏｃｏｍｐｕｔｅｒＡｐｐｌｉｃａｔｉｏｎｓ　Ｖｏｉ．２５，Ｎｏ．７，２００９　技术交流　微型电脑应用　２００９年第２５卷第７期　

文章编号：１００７．７５７Ｘ（２００９）７－００５１．０３　

基于Ｍｅａｎ．Ｓｈｉｆｔ的图像文本信息提取　

叶茂锹周武能　朱黎博　

摘要：图像和视频中包含着丰富的文本信息，提取和识另４图像文本信息非常具有实际意义。传统的图像文本信息提取方法　

大多基于字符的代数和几何特征。作者从另一个角度出发，将彩色字符看成彩色图像的一部分，使类似字符的景物也可以被　

当作字符识别出来。文中提出一种基于Ｍｅａｎ－Ｓｈｉｆｔ算法的图像文本信息提取方法，首先利用Ｍｅａｎ－Ｓｈｉｆｔ算法对图像进行分　

割，然后对分割得到的文本区域进行投影分析从而将每个字符分割出来，最后将字符识另ｑ。　

关键词：文本信息提取；Ｍｅａｎ－Ｓｈｉｆｔ图像分割；文本检测；投影分割　

中图分类号：ＴＰ３９１．９　文献标志码：Ａ　

０研究现状　

图像文本提取和识别技术可以广泛应用于各种需要对　

图像中文本进行检测、分析和理解的场合，比如涉外导游、　

盲人引路、机器人行走和智能监控系统等。图像中的文本分　

为两类：场景文本和人工文本Ｉ　１。场景文本是指作为场景部　

分出现的文字，人工文本是指为了辅助观众理解图像内容在　

后期制作添加到图像或视频帧中的文字。无论是场景文本还　

是人工文本，图像中的文本检测和识别都面临巨大的挑战。　

由于背景复杂、颜色丰富、文本字体的变化，使得图像中文　

本的检测非常困难，而且因为图像中的文字通常具有较低的　

分辨率，字符的识别率也较低。　

■ 　——■ｌ　●———————一　一＿　——啊翻■田　——■■翻—■一　

倒ｌ附有文本的彩图及对图中文本信息的提取　

图像中文本提取的研究最初来源于Ｏｈｙａ［　】等人对于路　

牌、车牌、商店的标牌及货运列车标牌的提取。后来经过　

Ｌｅｅ，Ｋａｎｋａｎｈａｌｌｉ等人在对货运集装箱的识别应用，Ｚｈｏｎｇ　

等人对ＣＤ和书籍封面的提取应用，Ｊｉａｎｇｙｍｇ　Ｚｈｏｕ［３１等人　

从ＷＷＷ图像中提取文本应用的发展，使得原先只能处理灰　

度水平的图像到能够处理彩色图像，而且解决的背景的复杂　

程度越来越高。近年来的工作主要集中在 Ⅵ　图像、自然　

图像和视频方面，这～新的领域吸引着大量的研究者，新的　

算法和方法层出不穷。　

本文从研究现状、主要技术方法、最新研究方向三个方　

面对视频文本检测和识别技术作一个比较全面的阐述并具　

体给出了一种基于Ｍｅａｎ－Ｓｈｉｆｔ算法的图像文本区域提取方　

法。　

ｌ　文本区域检测方法综述　

文本区域具有丰富的边缘、纹理、角点和颜色特征，并　

作者简介：叶茂锹，东华大学信息学院，硕士研究生，上海２０１６２０　

周武能，东华大学信息学院，教授，博士生导师，上海２０１６２０　

朱黎博，东华大学信息学院，教授，博士生导师，上海２０１６２０　

·５ｌ·　

且满足一定的规律。文本区域检测主要是利用文本区域的特　

征和规律等先验知识定位文本区域。　

ｌｌ】基于特征的方法　

基于特征的方法主要有：（１）基于边缘检测的方法。文　

本位于复杂背景下时可以根据图像中的边缘密度和强度特　

征来检测。这种方法算法速度快，但是不能适应复杂背景，　

容易出错。（２）基于角点检测的方法。文字具有丰富的角点　

信息，可以利用角点检测算子得到图像帧角点图像，再根据　

文本区域角点特点对角点进行过滤和聚类，从而得到候选文　

本区域。这种方法对中文文本等象形文字检测效果较好，对　

文本尺寸敏感。（３）基于纹理的方法。图像中的文本区域通　

常具有统一风格，可以将文本区域看作一种特殊的纹理来处　

理。这种方法具有一定通用性，但算法复杂度高，对字体和　

风格比较敏感。（４１基于连通域的方法。文本区域可以作为　

满足特定规则的单色区域来检测。这种方法处理速度和定位　

精度较高，适用于二值图像，对于具有复杂背景的灰度和彩　

色图像效果较差。ｆ５）基于时域特征的方法。这种方法利用　

文本的帧间时域信息，检测到候选文本区域。这种方法依赖　

于图像结构化处理方法，多用于文本候选区域的验证。　

ｌ　２基于学习的方法　

基于学习的方法采用实例学习的方法获取模型参数，提　

高了检测结果的可靠性。同时，可以通过增加学习样本扩充　

检测模式的范围，提高检测系统的鲁棒性。在基于学习的方　

法中神经网络具有自学习、强鲁棒性和推广能力。Ｌｉｅｎｈａｒｔ　

等使用多层前向反馈神经网络模型实现文本区域提取【”。此　

外，支持向量机（ＳＶＭ）等基于统计的学习理论也广泛的被应　

用于文本提取领域。Ｃｈｅｎ　Ｄａｔｏｎｇ等人提出一种基于ＳＶＭ　

的在复杂背景下检测文本的方法。　

以上分析可知，尽管文本区域的检测方法多种多样，但　

都是根据文本在图像中的代数和几何特性而设计的。本文从　

另一个角度出发，将彩色字符看成彩色图像的一部分，使之　

更切合自然语义实际。这样，类似字符的景物也可以被当作　

字符识别出来。本文提出一种基于Ｍｅａｎ．Ｓｈｉｆｔ算法的图像文　

本信息提取方法，首先利用Ｍｅａｎ－Ｓｈｉｆｔ算法对图像进行分　

割，然后对分割得到的文本区域进行投影分析从而将每个字　

下载后可阅读完整内容，剩余3页未读，立即下载

qzwucf

粉丝: 0
资源: 9

Mean-Shift算法在图像文本信息提取中的应用

meanshiftseg.zip_meanshift 图像_site:www.pudn.com

聚类分析Flickr照片地理数据的方法

基于MeanShift算法的图像特征提取matlab程序

图像跟踪实战：Mean Shift算法的应用与分析

mean shift算法在GitHub上的图片聚类应用

LSTM情感分析在多模态数据：从文本到图像，全面解读情感

高级图像处理技巧揭秘：使用SimpleCV进行分割、提取与融合技术

深入理解OpenMV图像跟踪技术：OpenMV图像跟踪

图像分割算法的巅峰对决：U-Net与其他算法的优缺点分析

MATLAB图像处理秘籍

最新资源