优化分类视频镜头聚类：Gauss混合模型与谱聚类结合算法

需积分: 5 26 浏览量更新于2024-08-11 收藏 274KB PDF 举报

"基于最优化分类的视频镜头谱聚类算法 (2007年)" 是一篇发表在《清华大学学报(自然科学版)》上的科研论文，主要关注于视频分析中的镜头聚类问题。该文由张建宁、孙立峰和钟玉琢三位作者共同完成，发表于2007年10月，卷号为47，期号为10。文章的核心内容是解决谱聚类算法中自动选择最优分类数量的问题。谱聚类是一种在视频分析领域广泛应用的无监督学习方法，能够有效地对视频镜头进行聚类，但它通常需要人为设定聚类的数量，这在实际应用中是个挑战。为了解决这个问题，论文提出了一种新的算法，它结合了分布式高斯混合模型（DGMM）和谱聚类。在该算法中，每个视频镜头被用一个分区域的DGMM进行特征建模。DGMM是一种概率模型，可以用来描述数据分布的复杂结构，尤其是当数据具有多个子群体时。通过这种方式，每个镜头可以被表示为一组模型参数的特征向量，这些向量随后用于谱聚类过程。关键创新点在于，该文提出了一个联合评价函数，这个函数不仅考虑了DGMM的建模效果，还综合了谱聚类的性能。通过对这个联合评价函数的优化，算法能够自动确定最佳的分类数量和特征空间维数，从而避免了人工设定这些参数的困扰。实验结果显示，与传统的谱聚类算法相比，该新算法在视频镜头的聚类精度和效率上都有显著提升。这表明，通过结合DGMM的建模能力和谱聚类的聚类能力，以及自动选择最优参数的能力，该算法提供了一个更为有效的视频镜头分析工具。关键词包括多媒体技术、视频分析、谱聚类和Gauss混合模型，这些标签反映了论文的研究方向和技术重点。根据中图分类号TP37，可以判断这篇论文属于计算机科学技术领域的研究，特别是与数据处理和模式识别相关的部分。文献标识码A代表了该篇论文的原创性科学研究，文章编号1000-0054(2007)10-1700-04则为论文的特定引用标识。这篇论文为视频分析领域提供了一种创新的、自动化程度更高的镜头聚类方法，对于理解和改进视频内容的理解和处理具有重要价值。

ISSN

1000-0054

清华大学学报(自然科学版)

2007

年第

卷第

期

37/40

1700-1703

11-2223/N

Tsinghua

Univ

CSci

Tech)

2007

No.10

基于最优化分类的视频镜头谱聚类算法

张建宁，

手

、立峰，

钟玉琢

(清华大学计算机科学与技术系，北京

100084)

摘要:谱聚类是目前最有效的视频镜头聚类算法之一，但

是如何自动选择最优化的分类个数仍是谱聚类算法中的难

题。该文提出一种基于最优化分类的视频镜头谱聚类算法，

对每个镜头采用分区域的

Gauss

混合模型

CDGMM)

进行特

征建模，并提取模型参数特征作为镜头谱聚类的特征向量，

通过构造

DGMM

和谱聚类的联合评价函数来自动选择最

优化的分类个数和特征空间维数。实验结果表明，该文提出

的算法比原有谱聚类算法分类结果更加准确和有效。

关键词:多媒体技术;视频分析;谱聚类

Gauss

混合模型

中图分类号:

文献标识码

文章编号

1000

【

0054(2007)10-1700-04

Video

shot

spectral

ustering

algorithm

optimized

automatic

uster

model

selection

ZHANG

Jianning , SUN

feng , ZHONG Yuzhuo

(Department

Computer

Science

and

Tecbnology,

Tsingbua

University, Beijing 100084,

Cbina)

Abstract:

Spectral

clustering

is one of

the

most

efficient video

shot

clustering

algorithms.

The

automatic

cluster

model selection is

still

open

issue for

the

spectral

clustering

algorithm.

This

paper

presents

a video

shot

spectral

clustering

algorithm

that

incorporates

optimized

automatic

cluster

model selection. A

distributed

gauss

mixture

model

(DGMM)

used

represent

the

spatial-temporal

features

of each

shot

with

the

model

parameters

used as

the

feature

vectors

for

the

spectral

clustering.

the

DGMM

and

the

spectral

clustering

measurements

are used to in a globally optimized

method

automatically

select

the

number

clusters

and

the

feature-space

dimensi

∞.

Tests

show

that

the

method

gives

better

cluster

model

selections

and

clustering

results.

Key

words:

multimedia

technology;

video

analysis;

spectral

clustering;

Gauss

mixture

model

(GMM)

视频镜头的检测

[1.2J

和分类

[3J

是基于内容视频

检索的基础。视频镜头的分类可以分为有监督的学

习和无监督的聚类。有监督的学习通过训练分类器

或统计概率模型向对视频镜头进行分类，其优点在

于分类的准确性较高。无监督的聚类与它相比具有

自动学习视频内容和无需大量人工标注等优势，但

是对于初始划分比较敏感，并且对于不均匀分布的

样本集分类效果不佳。

Gauss

混合模型

(GMM)

被用

来在镜头间进行层次性聚类町，该方法根据样本在

特征空间上的

Gauss

分布特性，有效地用多个

Gauss

分量来表征不均匀分布的各类样本集，但是

分类个数的选择以及对分类误差的度量仍不十分有

效。谱聚类算法也

应用到视频镜头分类中比上述聚

类算法具有更好的分类效果[叭但是同样面临着分

类个数选择的问题。另外在上述聚类方法中，镜头内

的特征向量一般选取关键帧或者平均颜色直方图来

表征，这些特征并不能很好地表征镜头内对象的分

布和动态特性。

最小描述长度

(MDL)

被用来在基于统计模型

的聚类中作为聚类有效程度的度量标准[气在谱聚

类算法中

[8J

采用特征间隔和相关划分

个评价函数

来分别度量。这些度量着重考虑数据的分布特性，而

没有很好地考虑到语义和特征维数对分类的影响，

因此应用于视频镜头的聚类方面效果不是很理想。

针对上述问题，本文提出一种基于最优化分类

的视频镜头谱聚类算法，采用

DGMM

对镜头的特

征建模并提取模型参数作为谱聚类的特征向量，能

够更加准确地描述视频镜头的对象分布和动态特

性，并通过构造

DGMM

模型和谱聚类的联合评价

函数来自动选择最佳特征空间维数和最优化的分类

个数。

收稿日期:

2006-10-11

基金项目

国家自然科学基金资助项目

(60503063;

60432030)

作者简介

张建宁(1

979

一)

，男(汉)

，江苏，博士研究生。

通讯联系人:钟玉琢，教授，

E-mail:

zyz-dcs@mail.

tsinghua.edu.cn

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38502639

粉丝: 6
资源: 913

优化分类视频镜头聚类：Gauss混合模型与谱聚类结合算法

谱聚类算法MATLAB

谱聚类算法对数据点进行分类

谱聚类算法研究谱聚类算法研究.pdf

基于密度调整的改进自适应谱聚类算法

论文研究-基于密度峰值优化的谱聚类算法.pdf

基于共享近邻的自适应谱聚类算法

谱聚类算法

论文研究-基于最优投影的半监督谱聚类算法.pdf

基于meanshift的谱聚类算法

基于粒子群优化的PPI网络谱聚类算法

最新资源