小 型 微 型 计 算 机 系 统 2016 年 月 第 期
Journal of Chinese Computer Systems Vol.30 No. 2016
收稿日期:2016-8-29 基金项目:国家自然科学基金(61373015,61300052),江苏省自然科学基金青年基金(BK20130810),南京航空航天大学
研究生创新基地(实验室)开放基金(kfjj20151603,kfjj20161603),中央高校基本科研业务费专项资金资助 作者简介:黄火荣,男,1992 年生,
硕士研究生,CCF 学生会员,研究方向为移动对象数据库;许建秋(通信作者),男,1982 年生,博士,副教授,硕士生导师,研究方向为移动对
象数据库;秦小麟,男,1953 年生,教授,博士生导师,研究方向为分布式环境的数据管理与安全.
轨迹数据的连续距离查询技术
黄火荣,许建秋,秦小麟
(南京航空航天大学 计算机科学与技术学院,江苏 南京 211106)
E-mail :jianqiu@nuaa.edu.cn
摘 要:随着移动应用的增加,大量移动对象轨迹数据的分析变得越来越重要,轨迹数据的查询成为研究热点。本文提
出了移动对象轨迹数据的连续距离查询,返回在时间段[
t
1
,
t
2
]内距离目标对象的距离在[
d
1
,
d
2
]内的轨迹数据。采用 3D
R-tree 索引,提出了连续距离查询算法,并针对轨迹数据过滤方法进行了优化。针对长轨迹数据,通过轨迹分割将长轨
迹分割成若干短轨迹进行索引查询,提高查询效率。采用真实和合成的轨迹数据集,通过比较本文提出的方法与基于
TB-tree 的查询方法和基于 SETI 索引的查询方法的实验结果表明:基于 3D R-tree 和轨迹分割的连续距离查询方法具有
更好的查询性能。
关键词:移动对象;连续距离查询;轨迹分割
中图分类号:TP311 文献标识码:A 文章编号:1000-1220(2016)02--
Continuous Distance Queries over Large Trajectory Data
HUANG Huo-rong,XU Jian-qiu,QIN Xiao-lin
(
College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China
)
Abstract: With the growing number of mobile applications, data analysis on large sets of trajectories becomes increasingly important,
queries over trajectories become a hot research topic. This paper presents continuous distance queries over large trajectory data, each
query returns a subset of trajectories that away from the query trajectory between d
1
and d
2
in the time interval [t
1
, t
2
]. The algorithm
of continuous distance queries based on 3D R-tree was proposed, and the filter of trajectory data is also optimized. For the long
trajectory, it is split into several shorter trajectories so as to improve the efficiency of continuous distance queries.
Using both real
and synthetic datasets,
the query efficiency of the proposed method and those based on TB-tree and SETI address that the
continuous distance queries based on 3D R-tree and trajectory splitting is more efficient to other methods.
Key words: moving objects; continuous distance queries; trajectory split
1 引 言
近年来,随着智能移动设备的普及,无线通讯技术的不
断发展,定位技术越来越精确和方便,获取大量移动对象位
置信息成为可能。对移动对象的位置信息的采集、管理与查
询,促进了各种基于移动对象数据库的应用的研究,如地理
信息系统、交通管理、城市规划和大量基于定位的服务。通
过研究移动对象的轨迹,发掘移动对象的行为模式,研究移
动对象的社会关系,为决策提供参考
[1-5]
。例如通过研究车
辆的行车轨迹,可以得到人们的出行模式,为交通管理提供
参考。
目前移动对象数据库的研究取得了大量成果,例如移动
对象数据库的存储、管理和查询。针对不同的应用场景,需
要不同的数据库查询操作,提供高性能的数据查询,用以支
撑应用对移动对象数据库的数据查询的效率需求。查询操作
作为数据库的基本操作,它的效率的高低决定着这个数据库
是否能够提供高效的服务。因此,有一个高效的查询操作,
能够返回用户的查询结果,是至关重要的。目前,针对移动
对象的查询有范围查询、K 近邻查询、反向 K 近邻查询、密
度查询和轨迹相似查询等
[6-12]
。范围查询,查询在某一时间
段内位于查询范围内的所有移动对象,其中查询范围是一个
多维的空间范围。K 近邻查询,查询返回距离查询对象最近
的 K 个对象。然而,范围查询只返回指定时间和空间范围内
的对象,不能根据查询对象位置的移动而改变查询的范围。
K 近邻查询返回 K 个最近的对象,不包含精确的距离值。
本文考虑以下查询请求:
(1) 查询出租车 A 在 2015 年 1 月 11 日早上八点到下
午三点,周围 10 米到 100 米范围内的所有车辆的运动轨迹;