基于频率谱变化量的唐卡图像头饰特征与分类研究

需积分: 14 0 下载量 181 浏览量 更新于2024-09-07 收藏 646KB PDF 举报
"本文探讨了一种新的并行遗传算法(GA)和人工神经网络(ANN)结合的预测模型在图像处理领域的应用,特别是在唐卡图像的头饰分类中的表现。研究中,作者提出了一种利用频率谱变化量来表示图像轮廓特征的新方法,此方法在宗教类唐卡图像的头饰分类中取得了显著成果。" 在当前的网络信息技术环境下,基于内容的图像检索已经无法充分满足用户对图像检索的复杂需求,于是基于语义的图像检索成为了一个重要的研究方向。图像标注是这一领域中的关键环节,它连接了图像的低层次视觉特征和人类对图像的高级理解。图像标注通常分为人工标注、半自动标注和自动标注三种方式。由于大规模数据集的人工标注不切实际,而自动标注技术尚不成熟,半自动标注成为了一个实际可行的选择。 在图像特征提取中,颜色、纹理等特征相对容易获取,但轮廓特征的提取却是一个挑战。研究者们提出了一系列的轮廓特征提取方法,如链码、傅里叶描述子、不变矩和中轴变换等。本文中,作者针对唐卡图像的头饰分类问题,采用了一种新的方法:首先,通过结合基本全局阈值和用户观察直方图选择阈值来分割图像的头饰区域;接着,将像素点转化为直角坐标系下的坐标点,提取典型轮廓点;然后,运用傅里叶变换将这些点转换到频域空间,通过分析频率谱值较小部分的变化量来获取轮廓特征。此外,还结合头饰内部的颜色特征,以增强分类效果。 以往的研究包括Kunttu等人提出的多尺度傅里叶描述子的形状分类方法,胡学友等人在路标识别中应用的独立成分分析的形状识别技术,以及刘亦书等人构建的基于物体轮廓曲线的不变量高斯描述子。在唐卡图像头饰的半自动标注研究中,采用最小二乘曲线拟合方法表示头饰轮廓特征,并成功实现了分类。本文进一步发展了这一思路,提出基于频率谱变化量的轮廓特征表示法,结合颜色特征,提高了唐卡图像头饰分类的准确性,从而有效地支持了唐卡图像的半自动标注过程。 这项工作对于唐卡图像的语义检索具有重要意义,尤其是在理解和分类唐卡这种富有文化内涵的艺术形式时,准确的图像特征提取和表示方法能够极大提升检索效率和准确性。通过这样的技术,我们可以更好地理解和保护这类文化遗产,同时为其他复杂图像处理任务提供了一条可能的研究路径。