手势视频分类研究:基于张量分解与可视化的创新方法

需积分: 9 1 下载量 151 浏览量 更新于2024-09-07 收藏 401KB PDF 举报
"这篇论文是关于基于张量分解可视化的手势视频分类研究,由井佩光、刘琛琛和张承乾共同完成,受到了高等学校博士学科点专项科研基金的资助。该研究关注如何利用张量高阶奇异值分解(HOSVD)进行手势视频的表示和识别,并探讨了张量分解的可视化在提高手势识别准确率中的作用。" 在当前数字化时代,数据的规模呈爆炸式增长,数据结构也逐渐由低阶向高阶发展。张量作为高阶数据的表示形式,具有处理复杂多维信息的优越性。特别是在处理如手势视频这样的多媒体数据时,由于视频可以被看作是时间、空间和颜色三个维度的组合,因此适合用三阶张量来描述。 论文中,研究者们利用张量分解的高阶奇异值分解方法(HOSVD)来解析和理解手势视频数据。HOSVD能够提取张量的各阶本征矩阵,这些矩阵对于理解数据的内在结构和模式至关重要。为了进一步理解和展示这种结构,研究者们将这些本征矩阵可视化,以直观地揭示数据的潜在特征。 在手势视频识别的环节,研究者首先将张量的各阶本征矩阵映射到格拉斯曼流形上。格拉斯曼流形是一个用来处理线性空间的子空间集合的数学构造,它为非欧几里得几何提供了一个框架,使得在这种高维空间中进行距离和相似度计算成为可能。接下来,通过计算典型角(Canonical Angle),即本征矩阵之间的相似度,来量化不同手势间的差异。最后,采用最邻近分类器进行分类,利用这些相似度信息来决定手势类别。 实验在剑桥手势数据库上进行,结果显示,张量分解的可视化方法能够有效地提升手势识别的准确率,证明了这种方法在手势识别领域的潜力和价值。论文的关键词包括张量分解、可视化、高阶奇异值分解以及手势分类,涵盖了研究的核心内容和技术手段。 这篇工作对于理解高阶数据的处理和分析,特别是应用于多媒体内容分析和信息安全等领域,提供了有价值的理论基础和实践方法。通过深入研究张量分解及其可视化技术,有助于推动手势识别乃至更广泛的视觉计算和人工智能技术的发展。