改进的
改进的改进的
改进的基于
基于基于
基于密度
密度密度
密度的
的的
的航迹
航迹航迹
航迹聚类
聚类聚类
聚类算法
算法算法
算法
赵恩来
赵恩来赵恩来
赵恩来
1
,
,,
,郝文宁
郝文宁郝文宁
郝文宁
1
,
,,
,赵
赵赵
赵
飞
飞飞
飞
2
,
,,
,陈
陈陈
陈
刚
刚刚
刚
1
,
,,
,邵校
邵校邵校
邵校莎莎
莎莎莎莎
莎莎
1
(1. 解放军理工大学工程兵工程学院,南京 210007;2. 中国海上卫星测控部,江苏 无锡 214400)
摘
摘摘
摘
要
要要
要:
::
:为解决雷达站观测数据的分类问题,提出一种改进的基于密度的航迹聚类算法。采用加权Manhattan距离与惩罚系数相结合的距离
度量,根据目标运动的特征自定义点的邻域,利用时间裁剪提高算法运行效率。实验结果表明,该算法能高效准确地对数据进行聚类,形
成运动目标的航迹。
关键词
关键词关键词
关键词:
::
:聚类;航迹;密度;邻域;时间序列
Improved Track Clustering Algorithm Based on Density
ZHAO En-lai
1
, HAO Wen-ning
1
, ZHAO Fei
2
, CHEN Gang
1
, SHAO Xiao-sha-sha
1
(1. Engineering Institute of Corps of Engineers, PLA University of Science & Technology, Nanjing 210007
2. China Spacecraft Maritime Tracking and Control Department, Wuxi 214400, China)
【
【【
【Abstract】
】】
】In order to classify the data of radar, this paper proposes an improved track clustering algorithm based on density. Considering concrete
application, the algorithm adopts the distance measure by Manhattan distance and penalty coefficient, newly defined the definition of neighborhood
using the character of moving object, and improves the efficiency by time clipping. Experimental result shows that the improved algorithm can
cluster the observation data accurately and form the tracks efficiently.
【
【【
【Key words】
】】
】clustering; track; density; neighborhood; time series
DOI: 10.3969/j.issn.1000-3428.2011.09.094
计 算 机 工 程
Computer Engineering
第 37 卷 第 9 期
Vol.37 No.9
2011 年 5 月
May 2011
·
··
·开发研究与设计技术
开发研究与设计技术开发研究与设计技术
开发研究与设计技术·
··
·
文章编号
文章编号文章编号
文章编号:
::
:1000—
——
—3428(2011)09—
——
—0270—
——
—03
文献标识码
文献标识码文献标识码
文献标识码:
::
:A
中图分类号
中图分类号中图分类号
中图分类号:
::
:TP301.6
1
概述
概述概述
概述
将物理或抽象对象的集合分组成为由类似的对象组成的
多个类的过程被称为聚类。由聚类所生成的簇是一组对象的
集合,这些对象与同一个簇中的对象彼此相似,与其他簇中
的对象相异
[1]
。聚类分析已在许多领域广泛地应用,包括模
式识别、机器学习、图像处理、数据分析及市场研究等。没
有任何一种聚类算法可以普遍适用于揭示各种多维数据集所
呈现出来的多种多样的结构
[2]
。目前的聚类算法主要可分为
划分算法、层次算法、基于密度的算法、基于网格的方法和
基于模型的方法等。
为发现任意形状的簇,研究者提出了基于密度的聚类方
法。这类方法将簇看成是数据空间中被低密度区域分割开的
高密度对象区域。其主要思想是:只要“邻域”中的密度
(
数
据点的数目
)
超过某个阈值,就继续聚类,即对给定类中的每
个数据点,在一个给定范围的区域中必须至少包含某个数目
的点
[1, 3-4]
。时间序列是指按时间顺序排列的观测值集合。在
对时间序列进行数据挖掘的过程中,必须考虑数据间存在的
时间关系,这类数据挖掘称为时间序列数据挖掘。对时间序
列进行聚类的算法
[5]
有基于相似性
(
或距离
)
、基于特征、基于
模型和基于分割的聚类分析。
本文利用基于密度的时序数据聚类方法解决航迹寻找问
题,对航迹寻找问题进行了简单描述,提出基于密度的时序
数据聚类算法对问题进行求解,采用文献
[6]
的数据进行实
验,并对实验结果进行分析。
2
问题描述
问题描述问题描述
问题描述
某个 时刻某雷达站接受到空间某目标反射回来 的电磁
波,它将按顺序记录下有关的数据,并进行计算,得到包括
目标的观察时刻、经度、纬度、海拔高度、经向速度、纬向
速度和
id
在内的一组数据
[6]
,部分如表
1
所示。其中,观测
时刻
t
按时、分、秒记录,如
134459
表示
13
时
44
分
59
秒;
经度
j
和纬度
w
按度、分、秒记录,如
1215558
表示
121
度
55
分
58
秒。
表
表表
表
1
某雷达站观测数
某雷达站观测数某雷达站观测数
某雷达站观测数据
据据
据
id
观测时刻 t
经度 j
纬度 w
海拔高度 h
/m
经向速度 v
j
/(m·s
-1
)
纬向速度 v
w
/(m·s
-1
)
1
134459 1215558
290536
6
000 199.2 46
2
134500 1213738
291244
4
000 210.8 271
3
134500 1214720
292328
4
000 186.9 22
4
134508 1215647
290619
6
000 199.7 45
5
134509 1213631
291243
4
000 211.7 271
6
134509 1214746
292415
4
000 186.1 23
7
134517 1215736
290705
6
000 201.1 44
8
134524 1193311
264857
6
000 213.3 178
航迹是指某雷达站接受到某一检测目标陆续反射回来的
电磁波后记录、计算检测目标所处的一系列空中位置而形成
的离散点列。它是一个点集、一个簇。在这个簇中,所有点
都应属于该目标运动轨迹上的点,而不属于这个目标运动轨
迹上的点应不属于这个簇。而噪声或干扰点应不属于任何一
个簇,即它们不能构成航迹。由于每条记录上都带有时 间
戳
t
,因此表
1
可以看作是时序数据库,每条记录之间的时间
先后顺序对于寻找航迹至关重要。如何快速准确地从时序数
据库中找到不同目标的航迹,是本文所要解决的问题。航迹
中的点在时间上具有先后顺序,在三维空间
(
经度
-
纬度
-
高度
)
分布上具有连续性,在速度空间
(
经向速度
-
纬向速度
)
上具有
作者简介
作者简介作者简介
作者简介:
::
:赵恩来(1985-),男,硕士研究生,主研方向:数据工程,
聚类分析,时间序列相似性分析;郝文宁,副教授、博士;赵 飞,
助理工程师;陈 刚,副教授、硕士;邵校莎莎,硕士研究生
收稿日期
收稿日期收稿日期
收稿日期:
::
:2010-10-08 E-mail:
::
:lgdxzel@163.com