四元数卷积神经网络：彩色图像特征的深度探索

87 浏览量更新于2024-06-20 收藏 1.03MB PDF 举报

四元数卷积神经网络（QCNN）是一种创新的深度学习架构，它旨在解决传统实数域卷积神经网络（CNN）在处理彩色图像时的局限性。实数CNN已经在计算机视觉领域取得了显著成就，但它们在处理多通道输入时，如彩色图像，存在两个主要问题。首先，通过简单地对不同通道的输出求和，它们忽视了颜色通道之间的复杂交互，可能导致颜色结构信息丢失，图像表示可能不是最优的。其次，过多的自由度可能导致过拟合问题，即使采用了正则化手段。 QCNN的提出者Xuanyu Zhu等人认识到这些问题后，设计了一种全四元数卷积神经网络，该网络在四元数域上重新定义了卷积层和全连接层等基础模块。四元数是一种复数的扩展，它可以自然地表示彩色图像中的颜色空间，这使得QCNN能够更好地捕捉和表达颜色信息之间的内在关系。在四元数卷积过程中，每个核不仅考虑单个通道的输出，还能同时处理多个通道的交互，从而提高特征表示的精确性和有效性。实验结果显示，相比于实数CNN，QCNN在彩色图像分类和去噪任务中表现更优。它不仅可以提供更丰富的颜色特征，而且通过减少过拟合的风险，提高了模型的泛化能力。QCNN的兼容性使其可以轻易地嵌入到现有的深度学习框架中，为彩色图像处理领域的研究者提供了新的可能性。关键词包括“四元数卷积神经网络”，“基于四元数的层”，“彩色图像去噪”，以及“彩色图像分类”。总结来说，四元数卷积神经网络是对传统CNN在彩色图像处理上的一种有益补充，它利用四元数的独特性质来改进特征提取和模型性能，为计算机视觉研究开辟了新的探索方向。

X. Zhu等人

基于四元数的谐波分析已经得到了很好的发展，并且已经提出了许多

算法，

例如：

四元数傅里叶变换（QFT）[29]、四元数小波变换

（QWT）[1，35]和四元数卡尔曼滤波器[2，39]。这些算法中的大多数

已经被证明对3D对象比实值对象更好地工作。在计算机视觉和图像处

理领域，基于四元数的方法也在许多任务中显示出其潜力四元数小波

变换[1，17]、四元数主成分分析[40]和其他四元数彩色图像处理技术

[37]的优点已被证明可以提取彩色图像的更具代表性的特征，并在彩

色图像分类等高级视觉任务在图像去噪和超分辨率等低级最近，基于

四元数的神经网络也被提出并用于分类任务[3，27，30]。然而，如何

设计四元数CNN仍然是一个悬而未决的问题。

2.2

实值CNN及其扩展

卷积神经网络是许多视觉任务中最成功的模型之一自从LeNet [21]在

数字识别方面取得成功以来，已经取得了很大的进展AlexNet [20]是第

一个深度CNN，在图像分类任务中大大优于过去所有然后，提出了许

多具有深度和复杂结构的模型，如VGG [31]和ResNet [13]，它们在

ILSVRC [6]中取得了令人难以置信的成功。最近，CNN模型也被引入

用于低水平视觉任务。例如，SRCNN [7]将卷积神经网络应用于图像

超分辨率，并优于经典方法。对于其他任务，如去噪[24]和修复

[34]，CNN也取得了令人鼓舞的结果。

一些努力已被用于将实值神经网络扩展到其他神经网络。 er数字字

段。复值神经网络已经建立并得到了证明在泛化能力上具有优势

[15]，并且可以更容易地优化[26]。音频信号可以自然地表示为复数，因

此复CNN比实值CNN更适合此类任务。已经证明，深度复杂网络可以在

音频相关任务上获得与实值模型竞争的结果[32]。在[9]中，提出了一种

深度四元数网络。然而，它的卷积只是用四元数的乘法代替实数乘法，

其四元数核没有进一步参数化。然而，我们提出的四元数卷积对于彩色

图像处理任务具有物理意义。

提出的四元数CNN

3.1

四元数卷积层

专注于彩色图像表示，我们的四元数 CNN 将彩色图像

视为

，定义

为

[

n n

′

]

∈

，

其中

剩余16页未读，继续阅读

cpongm

粉丝: 6

四元数卷积神经网络：彩色图像特征的深度探索

基于卷积神经网络的图像识别研究

基于Snake模型和四元数描述的彩色图像边缘提取方法.

基于四元数的彩色图像质量评价方法 (2010年)

四元数卷积神经网络：超越传统CNN，革新彩色图像处理

四元数卷积神经网络：图像识别应用的突破与实践

四元数卷积神经网络：图像去噪新方案的全方位解读

四元数卷积神经网络：图像处理效率与准确性的双重提升

四元数卷积神经网络：从理论到优化的深度解析

基于四元数卷积神经网络的移动机器人闭环检测.pdf

基于四元数时空卷积神经网络的人体行为识别.pdf

最新资源