活动的个人移动性分析：纯时间建模方法

132 浏览量更新于2023-10-15 收藏 886KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

跟踪：认知计算WWW 2018，2018年4月23日至27日，法国里昂409基于活动的移动性分析：一种纯时间建模方法Shreya Ghosh1，Soumya K Ghosh1，Rahul Deb Das2， 3，Stephan Winter3印度理工学院计算机科学与工程系印度Kharagpur 1瑞士苏黎世大学地理系2澳大利亚墨尔本大学基础设施工程系3shreya. gmail.com，skg@iitkgp.ac.in，rahul.geo.uzh.ch，winter@unimelb.edu.au摘要一些研究已经表明，人类运动的时空移动性轨迹可以用于识别个体。然而，这项工作提出了一个新的框架，基于活动的个人的mobility配置文件只使用时间信息。该框架有利于在时间尺度上对个体的活动模式进行关键词时间建模，移动轨迹，人类活动，用户分析ACM参考格式：Shreya Ghosh1 ， Soumya K Ghosh1 ， Rahul Deb Das2 ，3 ， StephanWinter3。2018年。基于活动的移动性分析：一种纯时态建模方法。在WWW'18伴侣：2018年网络会议伴侣，2018年4月23日至27日，法国里昂。ACM，NewYork，NY，USA，8页。 https://doi.org/10。1145/3184558.31863561引言随着传感器技术、无线网络广告和位置获取技术的普及，诸如旅行日志、GPS轨迹或活动信息的各种移动性信息可容易地用于分析并提供各种各样的基于位置的服务[1]，即旅行计划[2]、交通预测或个性化推荐系统。另一方面，移动数据对隐私很敏感，因为它收集了个人在空间和时间上的位置。然而，仅共享时间活动模式，而没有特定的位置信息，可以减少隐私问题。虽然已知人类移动性的时空特征提供了关于人类移动性行为的重要见解[3]，但问题是时间特征是否也足以映射行为模式。此外，可以比位置更准确地观察时间，而位置信息通常遭受不确定性或不精确性。这项工作的主要重点是拿出一个时间的流动性分析框架，能够唯一地识别一个人。分析或指纹的基本思想是将大量的移动性数据映射到更短的表示，以捕获本文在知识共享署名4.0国际（CC BY 4.0）许可下发布。作者保留在其个人和公司网站上以适当的归属方式传播作品的权利WWW©2018 IW3C2（国际万维网会议委员会），在知识共享CC BY 4.0许可下发布。ACM ISBN 978-1-4503-5640-4/18/04。https://doi.org/10.1145/3184558.3186356个人运动。据我们所知，没有现有的工作进行了个人的时间属性的基础上的剖析。为了进一步推进这一研究方向，本文的目的是在不同的时间尺度上模拟一个人的活动序列。活动的固有模式将被用于剖析（移动性剖析）该个体，以便得出他们的个人背景和意图。有许多问题需要解决，即，i）一个人如何在不同的活动抽象级别使用她的时间，以及如何在时间指纹中对这些日常活动序列进行建模？ii）在不同的时间尺度上显示出更好的一致性分数的活动之间是否存在一些关联，以及这如何有助于构建个性化推荐系统？问题定义：考虑一组用户和日常用户活动日志（例如，旅行、读书、工作）。目标是表示活动模式的特征集，使得可以表示每个用户（u，i）随时间的移动性模式，并且可以通过比较用户的移动性简档（MF，i）来测量用户的移动性模式之间的贡献：贡献可简要概述如下：i）使用Allen的时间演算对不同时间尺度中的人的活动序列进行建模;ii）提出活动-时间图，以分层方式捕获活动序列的时间属性;iii）移动性分析，以使用Graph-Edit距离的变体对个体的时间移动性模式进行指纹识别;以及iv）通过分析活动的可变性或熵来测量一致性模式。在研究的时间序列。实验结果表明，时间移动性剖析是能够捕捉人类移动的独特性，并提出的时间层次结构提供了一个洞察用户的活动模式此外，我们探索的时间一致性模式的活动序列，这是一个重要的因素，而测量用户之间的相似性。第二部分综述了该领域的研究进展。第3节描述了时间剖析架构的不同模块。框架的实验评估如第4节所示。第5节总结了本文的一些未来的工作方向。2相关作品在针对出行需求和出行模式的移动模式挖掘以及对这些轨迹进行语义分析以探索人类的移动意图或活动识别（包括隐私风险和匿名化技术）方面已经做出了重大的研究努力跟踪：认知计算WWW 2018，2018年4月23日至27日，法国里昂410（）下一页•（）下一页？12i+1我移动模式挖掘的研究工作主要集中在表1：由用户执行的活动的序列分析移动代理的GPS轨迹Yu等人[二]《中国日报》提出一个框架来对个人的位置历史进行建模ActivityType（ai）StartTime（ts） FinishTime（tf）并推断位置重要性和习惯性的旅行顺序。 Zhao等人[4]提出了基于统计和无监督聚类的方法来理解个体地铁乘客的时空模式。有关于总结GPS日志[5]、用户分类[6]以及找到用户集合的轨迹之间的相似性[7]的工作。这些示例代表了考虑轨迹的空间和时间属性理解人类运动的意图来预测我我乘坐公共汽车9.30 10.50阅读报纸9.45 10.20听音乐10.10 10.20与其他乘客10.30 10.40观看体育比赛比分10.30 10.40步行10.52 11.00下一步行动和观察个体的活动模式是构建任何上下文感知智能推荐系统的主要方面。 Wun等人[8]通过结合基于活动的分析和来自1500万个登记记录的移动分析，构建时间转移概率矩阵，对城市内部的人员流动进行建模。活动序列预测使用马尔可夫模型和回归树分类器来预测下一个活动发生的预期时间[9]是本文献中的一些重要贡献。原则上，共享位置数据不仅立即造成安全威胁或隐私问题，而且还因为人们在其日常生活中遵循或多或少的规律时间表Song等人[3]观察93%的潜在可预测性的人类动态探索移动模式的50,000手机用户三个月。反之亦然，出现了关于位置混淆的文献，其中为了保护隐私而引入了不准确性和不精确性[10]。Duckham等人[11]提出了位置隐私的时空模型，其表示具有模糊位置知识的个人随时间的移动，以及关于该知识的细化如何可能侵犯个人隐私的推测。我们提出的方法在许多方面不同于现有的研究首先，我们不包括位置信息在我们的分析，因为共享位置信息可能会表现出隐私入侵。此外，而不是使用时间作为一个离散的功能，我们使用几个定性的tempo- ral关系模型的活动序列的个人。以前，移动模式之间的时间相关性已经通过将时间分割成不同的时间片或时间间隔来分析，而我们提出了一种时间移动性模型。并获得用户时间移动性简档。移动性简档可以用于用户的标识、用于用户简档的相似性度量以及用于对活动的时间一致性模式的分析。通常，用户之间的类似简档可以有助于基于用户的活动模式对用户进行聚类或分类，而识别准确度描绘了移动性简档的唯一性度量。分析活动在不同时间尺度上的一致性模式有助于智能推荐系统的实现。3.1预赛在这里，我们定义了一些初步的概念，随后在本文中使用。活动节点活动节点A被定义为有序对ai，Ti，其中ai表示由个体执行的活动名称，T i表示活动的时间间隔，由开始时间ts和结束时间tf组成。表1示出了一些活动名称i和活动的时间值。的活动。表1的每一行构成一个活动节点。活动理论为建模活动提供了基础[12]。活动理论是通过一个层次结构来概念化的，在这个层次结构中，一个活动可以被分解成多个动作，然后动作再分解成多个子动作，等等。在这项工作中，活动节点被建模在一个分层表示的基础上的时间间隔Ti。活动序列如图2所示，一对活动节点基于活动的开始和结束时间框架，其中使用基于时间关系的几个层次级别来A序列=（ai，aj）∈{A}T Ri−→ aj（1）3时间移动性分析框架本文提出了一个概念框架来描述一个独立的TR表示如表2所示的任何两个活动之间的定性时间关系。由于时间是单调递增的，时态逻辑假设诸如“在时间间隔T1中执行的活动在时间间隔T2之前”之类的陈述。性活动序列将用于对个体进行分析T2iftfts”。<这种关于时间的推理是建立在以获得他们的个人背景和意图。图1概述了拟议框架。从人（特定服务的用户）的活动日志，（单连接）时间间隔和二进制的概念它们之间的定性关系，例如在艾伦每个时间间隔具有非零持续时间，即i：tstf，用于活动i。<活动序列被映射到活动-时间图（ATG），使用定性时间关系，随后提取个体的签名活动模式的时间不相交和并发活动集不相交活动集在时间尺度中定义模式挖掘模块分析活动D=.a我|t s≥t f，iΣ（2）·一跟踪：认知计算WWW 2018，2018年4月23日至27日，法国里昂411F∈转≥∈转JRJRJR节点A和活动之间的时间关系图1：时间移动性分析框架的工作流图2：活动序列到活动时间图的映射并发活动集由嵌入在时间尺度上的其他活动中的活动表2：遵循Allen时间演算的两个活动之间的时间关系时间关系网络表示时间间隔性质在活动的时间层次结构之后引入级别，并划分不相交和并发的活动集C=.a我|（t s≤ t s≤ t f）和（t s≤t f≤t），（三）因此，ATG=（A，E），表示用户在i∈ [0，…j，r，…n]}在表1的示例中，乘坐公共汽车和步行是不相交的活动，而其他活动都嵌入在乘坐公共汽车内。活动时间图（ATG）活动时间图是个人在一天内进行的所有活动的集合。的ATG在边E中，还提供了函数h：1到每个节点ai A，以及函数f：E_TR，其为每个边缘eiE分配该时间关系。在表1中的活动[也在图2中描绘]中，trav-乘公共汽车和步行是1级活动（l1），以及·（b）a2之前的aa1-（b）->a2tfts<1个2个一个2之后是一个1a1-（b）-a2tfts<二一一a2在（d）a1期间a1-（d）-> a2（t s a2t s= t s∧ t f a2t f= t f∧ t sa2tf=ts1个2个a2遇到a1a1-（m）-a2tf=ts二一一a1等于（e）a2a1-（=）-a2t f= t f∧ t s= t s二一二一a1与（o）a2a1-（o）->a2tstftf<<二一二跟踪：认知计算WWW 2018，2018年4月23日至27日，法国里昂412（）下一页（）下一页（）下一页（）（）∀（）（）（）（）∀阅读报纸、与其他乘客交谈以及观看体育比赛分数--在公共汽车上行驶的活动中嵌入或同时进行的活动--是2级活动（L2）。同样，听音乐是嵌入在一种l2活动中的，比如说，读报纸，因此是一种l3活动。3.2活动-时间层次活动序列（包括活动的重叠）是为了实现某些预期目标而进行的一系列活动。序列由节点（活动）和边（连接的活动之间的时间关系）表示表2描述了时间关系的完整集合在这里，两个活动（a1，a2）的所有可能的时间关系都使用开始时间（ts，ts）和结束时间（tf，tf）。人们如何进行并行活动。分裂导致一个适当的树结构，从而明确表示的活动时间层次结构。在级别 1 中，捕获 Al= （ ActivityName ， startTime ，finishTime）信息，并且f基于每个节点的时间值分配边缘信息从下一个级别开始，所有节点由Al =（l，p，T）表示，其中l是活动节点的级别或高度，T是相同级别的活动之间的并发时间关系的列表，并且p是嵌入Al的父活动。分层表示的概念对于比较ATG是有用的。它允许在输入ATG的宏观级别上分析活动类型，并且在不同应用中利用不同级别的知识。3.2.2提取个体签名活动模式。来1二一一二个由于Allen的时间演算是联合穷举和成对不相交的，并且由于根据上述定义，任何活动在开始和结束之间是单连接的，因此两个活动的任何序列具有这些定性时间关系中的恰好一个。因此，基于Allen的时间演算的时间剖析模型是完整的和明确的。3.2.1生成活动节点的基于时间的层次结构。由个体执行的活动可以基于时间尺度的粒度在分层结构中建模。为了生成有意义的分层活动结构随着个体的移动性分布，需要提取跟随最多的活动序列。签名ATG捕获在所研究的时间段内的常规活动序列。它导致了经典的问题，最大共同的子图从一对ATG，作为一个人的日常活动序列表示为ATG。为此，使用个体的所有ATG的图编辑距离测量，因为Bunke [14]正式证明了在给定的代价函数下，图编辑距离和最大公共子图是等价的问题。一般而言，该图将距离编辑得最好。（G1，G2）定义为：min（）λ∈实际上，对活动选择施加了额外的约束活动通常与兴趣点（POI）相关联（例如дedλG1，G2=minγ（G1，G2）ei∈λc（ei）（4）BeingAtHome或BeingAtUniversity），并且空间分离清晰构造活动的不相交子集位置的改变（例如，旅行）是与POI绑定活动不相交的活动从下一个级别开始，节点是在时间尺度上与上一级别活动并发的活动因此，人们参与一些POI绑定活动或旅行，并且因此这些活动包括级别1。从下一个层次的活动选择算法，贪婪迭代活动选择器，部署，找出并发活动的第一级和不相交的活动在每个级别。问题的最优解返回最大数量的这种不相交的活动。由于个体多任务能力的限制，并发活动的数量随着并发级别的增加而变少。此外，这项工作提出了一种迭代匹配两个ATG之间的水平的基础上因此，较高级别中的更多数量的活动提供了发现更大的匹配序列。在按照上述程序和时间层次规则确定活动的级别之后，可能需要对重叠的活动进行活动拆分。可能发生的是，较低级别（例如级别2）的活动与较高级别（例如级别1）的最后一个活动在时间上重叠，这违反了严格的时间层次规则;然后级别2活动被划分为两个活动实例，并且不重叠的部分移动到较高级别。例如，对于诸如[旅行，9.30 - 10.50>];[听音乐，10.40 - 11.00>]的活动日志，活动的时间层级将具有以下形式：[旅行，9.30 -10.50>，级别1];[听音乐，10.40 - 10.50>，级别2];[听音乐，10.50 -11.00>，级别3];[听音乐，10.50 - 11.00>，级别4];[听音乐，10.50 -11.00>，级别5];[听音乐，10.50 - 11.00>，级别6];[听音乐，10.50 -11.00>，级别7];[听音乐，10.50 - 11.00>，级别7];[听音乐，10.50 -11.00>，级别7];[听音乐，10.50 - 11.<<<<<表示编辑操作的成本本文研究了γG1，G2在-包括边（边插入、边移除、边替换或时间属性的修改）和节点（时间信息的修改）上的图形编辑操作。编辑距离的计算是通过寻找一系列的图形编辑操作，使成本最小化的路径遍历从源图到目标图。最大公共子图的特征被用作源图和目标图之间的签名特征在定义ATG的子图时，还考虑级别以及边和节点集。设 ATG1=A1 ， E1 ， l1 ， f1 和 ATG2=A2 ， E2 ， l2 ， f2 是两个ATG，则ATG2是ATG1的一个子图，用ATG2ATG1表示，如果• A2A 1• |不超过|L1|l1|• f1（ai，aj）=f2（ai，aj）;（ai，aj）∈A2×A2设 ATG1=A1 ， E1 ， l1 ， f1 和 ATG2=A2 ， E2 ， l2 ， f2 是两个ATG，则由保边顶点双射映射IG：A1→A2定义了一个图同构• a1=IG（a2）;a1∈A1• f1（ai，aj）=f2（IG（ai，aj））;（ai，aj）∈A1×A1如果ATG3与ATG1、ATG3与ATG2之间存在图同构，则ATG3是ATG1和ATG2的公共子图。同样，如果没有ATG1和ATG2的其他公共子图具有比ATG3更多的边，则ATG 3是最大公共子图。两个ATG的编辑距离дed（ATG1，ATG2）计算为：1级拆分是必需的，因为活动层次结构不仅表示多个时间尺度中的活动，而且还提供洞察力〇 ed（ATG1，ATG2）=min{C T（0）|是从ATG1到ATG2的ecдm}（五）跟踪：认知计算WWW 2018，2018年4月23日至27日，法国里昂413C（x）=1m（）下一页.∈−2...（）−12.| |L. 编辑距离计算器..Σ（）下一页111222一个人利用她的时间？分析活动的可变性用于计算。 |ATG|为M这里，ecgm是在图形编辑操作之后将ATG1变换为ATG2的纠错图形匹配函数。Bunke成本函数[14]的变化被应用于计算ATG的每个级别中的编辑距离。通过划分工作日和周末ATG来部署从ATG提取签名活动模式的方法。对于两组ATG，测量成对编辑距离常见的不相交的活动子序列（节点替换）是0ifai==ajanddTi==Tj--提取，然后分析时间相似性关系Cns（x）=1Ti∩TjTi∪Tj如果ai==aj且Ti≠Ti在每个节点的嵌入子图Cnd（x）=1C es（x）=.∞ifai≠aj0如果f1（x，y）=f2（（д（x），д（y））Σ（六）3.3时态模式挖掘在这一部分中，分析了活动的时间模式，包括分析活动的时间一致性模式，以及活动的定量和定性评分∞否则Ced（x）=1Cei（x）=1Cns、Cni、Cnd、Ces、Ced和Cei表示节点取代、节点插入、节点缺失、边缘取代、边缘缺失和边缘插入。对于节点替换，当活动名称和时间间隔都匹配时，成本为零。当仅活动名称匹配但时间间隔显示并发关系时，成本函数基于匹配两个节点所需的时间修改而改变。 Bunke [14]提出通过以下方法获得ECGM3.3.1活动的时间一致性模式。时间一致性模式从时间尺度上的活动性能的变化性观察到，其中时间是基于时间间隔Ti和活动的持续时间测量的。随机变量的变异性通常通过以下方式测量：熵，在信息论中是消息中信息内容的平均值。香农熵H [ 15 ]定义为：.nH=−c（f）= X.A′cns（x）+xA.1A′cnd（x）+xA.2A′cni（x）哪里nj=1j=1pj=1，并且p1，p2，.. . ，pn是经验概率-∈1+cese∈E1′∈−1个（e）+e∈E1−E1′ 香港海关（e）+e∈E2−E2′ cei（七）（e）城市分布在测量活动-时间对的总体可变性时存在两个明显的问题：ATG′（A′，E′）和ATG′（A′，E′）是ATG1和ATG2研究期间？b）VT：如何（就活动的可变性分别通常，两个图G1和G2之间的距离被测量为：（比如ai），我们研究活动日志中所有 i出现的startTime 和finishTime我们的目标是将活动实例划分为几个时态类，其中所有的startTime和finishTimedG，G=1|mcs（G1，G2）|xxx（|G1|、|G2|）（八）一个类的成员（或i的活动实例）保持在阈值（Tthresh）内。因此，活动的可变性这里，mcs是指G1和G2的最大公共子图。通常，G由节点的数量或边的数量表示。然而，在本文中，不同级别处的节点具有显著的重要性，因此另外地，级别和边是在时间尺度上计算，即，个体如何一致地执行活动，或者在时间阈值内开始和完成活动。为了测量startTime和finishTime可变性，可以测量在该时间点开始或结束的活动的频率级别L中的时间边缘的数量=1以迭代的方式应用站：首先，计算ATG的级别1元素之间的距离，然后计算较低级别。合理地，当测量2级节点（嵌入在1级节点内）之间的距离时，需要考虑1级节点的距离值。因此，总成本CT被给出为：.M同样的时间计算。(1) 观察完整研究时间的活动序列，并提取每个活动发生的实例总数。假设，活动ai在学习期间发生N次(2) 提取唯一的时间戳m（用于startTime和finish）。时间），并将数据分成m个类。(3) 计算每个此类类别j的频率（fj）。(4) 最后，根据等式11估计熵。CT=c1（д）+ci表示第一级费用。I=2ci−1（д）×ci（д）（9）使用香农提出了一种基于ATG水平的图编辑距离迭代计算方法，因为ATG水平不仅代表了不同时间尺度上的活动，而且内在地呈现了Vi=−MFJj=1Nlog2. fjΣN（十一）语义信息例如，在家里吃早餐时听音乐不同于在旅行时听音乐。其目标不仅是提取最大的子图，但提供更多的权重，不同级别的ATG在计算中。比方说，用户在所研究的时间段内执行了N次活动，并且该活动在m个唯一的时间间隔或类别上完成经验概率分布Pj是活动在活动的其他实例的相同时间间隔中发生的可能性。较大的Vi值表示更大的可变性，因此更小。将由映射施加的编辑操作的所有成本相加pjlog2pj（1l× |e（l）|得双曲余切值.|e（l）|是跟踪：认知计算WWW 2018，2018年4月23日至27日，法国里昂414（）下一页（）下一页10（）下一页（）下一页（[]）（−）/|∩|||（）（）||..更小的值指示时间尺度中的特定活动的更一致的模式，并且更小的值指示时间尺度中的特定活动的更一致的为了计算在一天的不同时间范围（VT）中的活动的变化性，将一天划分成两小时的时间片。对于每个时间片，提取每个级别的活动，用于计算这些活动在时间片中发生的概率。3.3.2时间尺度上的定量和定性相似性度量。活动的定量得分（Q1）和定性得分（Q2）是0和1之间的一致性值，其表示活动是在规则的时间间隔（ Q1 ）中执行还是遵循一致的序列（Q2）。对于定量的措施，开始时间和完成时间的活动节点被纳入，而时间关系进行了比较和分析的定性分析。算法1：定量时间分数的计算Q1个人的活动。输入：个体的ATG的集合：[ATG1V1，E1，E2]. . . ATGn Vn，En]输出：一组唯一的活动名称;每个活动名称的Q1><1初始化：TClass←活动的时间类的空优先级队列;TQ1←时间得分的空列表（Q1）;2A←ExtractAct（ATG）;从ATG中提取唯一的活动名称而|一|不是空的吗3TClass.insert（A[i]）; S←0;创建一个新的时态类4对于范围（0，|ATG|）做5tstart，tfinish←ATGj（A[i]）;提取时间间隔tthresh←tfinish−tstart;估计阈值6T开始，T结束← [tstart −tthresh，tstart+tthresh]，[tfinish −tthresh，tfinish +tthresh];7如果T开始t，则T在TClass结束8TClass.Key的递增频率值;9更新TClass.Key的优先级值;另外10个11时间间隔与现有类不匹配12创建新的TClass.Key;13设置频率值为TClass.键的114的端15S←S+1;或每个活动名称的定量得分为了简洁起见，活动的开始和结束时间由t开始和t结束来表示，并且每个时间类或分区的时间范围由T开始和T结束来定义。时间类的最大优先级队列被初始化，使得优先级由时间类的基数来维持。在提取唯一活动名称之后，估计活动名称的时间类的数量然后，通过基于时间间隔计算活动的（1-可变性）来测量定量分数在定性评分中分析活动节点的所有事件边缘在这里，事件边缘捕获时间信息：一个活动如何嵌入另一个活动（不同级别）以及它遵循的序列（同一级别中的前任和继任者节点）。遵循类似于算法1的过程，除了通过比较每个活动节点的边的时间信息来生成时间类。众所周知，人们的活动顺序在很大程度上是习惯性的;这些习惯可以遵循一些定性和一些定量措施。例如，一个人可以在早餐后一直服药（定性），但不一定在固定时间服药（定量）。在这方面，一系列活动（早餐后服药）显示出比定量测量更好的定性评分。在另一示例中，前往大学和上课在固定时间发生，因为这些是安排的活动。3.4时间活动信息的移动性剖析和相异度移动性简档MF=A，C，ATG由三个部分组成：活动名称ai的穷举集合A以及在整个研究时间内由个人执行的这些活动名称的频率fi（即，ai，fi）对、这些活动名称的时间一致性得分的列表C、以及存储个体用户的ATG的ATG列表，这些ATG通常针对工作日和周末分别进行分析。变异性测量作为个体之间唯一性测量的主要步骤。特别地，可以考虑移动性简档的三个特征：P1、唯一活动的集合及其对应的活动。用户执行的频率，p2，时间一致性16端部17T Q1[i]=−.|T Clas [ k ]。|TClass[k]. valuelog2TClas[k]。value;在任何一对活动之间的公共活动集合中的得分3k=1S18辆T型车。return（）;S用户，以及p，一对ATG之间的图形编辑距离。模拟相似性与两个实体或两个特征的共同性有关1920endPrintA[i]， 1−T Q1[i] >;Activity-name，Quantitative Score<价值观为了测量一组活动节点之间的相似性，提取两个移动性简档之间的共同活动名称以及所执行的活动的频率为对于开始时间和结束时间的比较，已经考虑了阈值tthresh=finishTime startTime D在我们的实验中，我们根据经验选择D=10，即活动持续时间的1/10当节点的开始时间和结束时间在t阈值时间差内时，两个节点在数量上相似。在通过层级的层级的迭代方法中，首先提取层级1的相似活动节点例如，假设两个用户（ui，uj）的两个移动性简档：MFiAi，Ci，ATGi和MFjAj，Cj，ATGj，其中Ai=Ni并且Aj = Nj。在线性扫描之后，可以提取Ai和Aj之间的公共活动名称，Ai Aj=m。活动a p的相对出现次数用fp表示。基于p1特征的Ai与Aj的相异度值是：然后，提取公共节点内的嵌入式活动节点，并且这继续直到ATG的最后一级已经被Dp1（Ai，Aj）=1−mr=1 min（fr∈Ai，fr∈Aj）（十二）.2×Nip=1考虑了算法1描述了计算Q1的过程Njq=1fp+东凤企业股份有限公司跟踪：认知计算WWW 2018，2018年4月23日至27日，法国里昂415Mr=1（）下一页×个.. wijk ×dijkk=1.− o唯一性度量定义为ξ=，其中NN−Dp（Ci，Cj）=r=1（）下一页m（Cr，i+Cr，j）使用等式12，基于它们在所研究的时间中的出现来计算任何一对活动名称之间的相异度值。Dp1的值位于区间[0，1]中接下来，计算一致性得分（或，1- 1）之间的相异度值。可变性）（持续时间和开始时间）。对于一致性得分中的每一个，相异度值是：.|Cr,i−Cr,j|其中Cr，i是移动性简档MF，i的活动名称的一致性得分。为了计算MFi和MFj的ATG之间的相异度，如前所述计算ATG之间的编辑距离。η个用户之间的相异性可以表示为ηη个相异性矩阵，其中每个值i、j表示用户i和j关于其时间活动模式的不同性因此，需要聚合P1、P2和P3的归一化（在0和1之间）相异度值聚合相异度值是每个特征变量的相异度值的加权平均值。Dij=3k=13wijk（十四）图3：活动的时间定量和定性评分其中wijk是每个特征变量的权重，k表示特征变量，并且dijk是针对特征变量k的移动性简档i、j之间的相异度值。此外，相似度值可以计算为（1-Dij）。4实验观察为了说明和评估时间剖面，我们进行了一项调查，收集个人的日常活动数据参与者（来自两个不同国家的两所大学）在基于网络的调查表中记录了他们在不同时间尺度上的日常活动。在这项活动调查中，具体列出了30项活动，调查的目的是也记录时间尺度上的同时活动。表3显示了在两周、三周或四周内从八名参与者收集的数据的总结在该表中，ATG被列为G A，E，l，其中A是活动节点的数量，E是时间关系的集合，并且l表示特定移动性简档的ATG的级别。用户的常规活动模式由工作日ATG和周末ATG表示，其在表3中由G1和G2示出。然而，一些用户（u1，u2，u6）有三个ATG的描述，这是从最大的子图是不唯一的事实。在我们的实验中，我们观察到两个最大的子图（从平日ATG），这些用户在相似性匹配过程中，包括在他们的移动配置文件的ATG。无论如何，如果用户在工作日或周末遵循两个常规活动模式，则用户可以在其移动性简档中具有两个（或更多个）ATGN δ1是参与者总数（有八个参与者我们的实验），δ〇定义与输入活动序列匹配的用户时间简档的数量。使用随机采样方法，选择来自每个个体的（u，i）移动性简档的任何活动序列（测试数据），并且基于不同的时间序列来测量所有其他用户的时间移动性简档之间的相似性。ATG的时间尺度（11、12、13）δ〇是与输入序列具有大于0的相似性分数的用户简档的数量。80. 表4示出了8个样品的ξ值L1+L2提供比单独的级别L1或L2更好的唯一性分数。该表还示出了时间嵌入信息比时间分辨率信息更有区别。更准确地说，如果单独分析ATG的每个水平，则11个活动的平均持续时间大于12，12大于13。因此，仅探索个体水平的活动序列提供了不同时间分辨率尺度的分析，并且忽略了所有并发活动模式。另一个观察结果表明，独特性得分不同的Q1和Q2的测量。为此，将活动分为两组，其中一组的要素在数量上具有更好的一致性，而另一组在质量分析上具有更好的一致性。相似性匹配过程结合了基于Q1和Q2计算的活动分离，产生了更好的唯一性得分(last表4中的ATG列）。这些实验发现在许多方面都很重要首先，它们证明了上述理论框架仅基于个体的时间模式以有意义的方式表征和比较个体的活动序列的能力。虽然实验的参与者人数较少[8名参与者]，但由于工作调查了个人的活动模式，因此足以进行实验。此外，收集参与者的详细活动日志[每个参与者的至少14天的活动日志并且包括平均18-20次活动/天]。该数据集允许说明框架，并表明时间概况是个性化的。还已经表明，这些签名模式不一定是唯一的，并且可能需要多于一个ATG来捕获个体的常规活动模式。这在工作日和周末是可以预料的，但在几周内也发生过，例如对个人而言（十三）2跟踪：认知计算WWW 2018，2018年4月23日至27日，法国里昂416表3：八名参与者的时间活动统计和ATGuserId号天号活动平均数活动次数活动平均持续时间（小时）ATG描述1级2级3级u12826242214.55.6G1（16，E1， 3），G2（13，E2，3），G3（18，E3， 3）u221211820154.5G1（16，E1， 3），G2（20，E2，3），G3（17，E1， 3）u328181422.5166G1（11，E1， 3），G2（14，E2，3）u42114122015.53.2G1（12，E1， 2），G2（15，E2，2）u514181521.5167.6G1（13，E1， 3），G2（17，E2，3）u61815142114.67.2G1（14，E1， 3），G2（10，E2，3），G3（11，E1， 3）u714161418126.5G1（14，E1， 3），G2（12，E2，3）u821251622158G1（15，E1， 3），G2（14，E2，3）表4：在工作日的用户时间活动序列的8个样本上的ξ得分-l1（ Q1）l1（ Q2）l2（第一季度）l2（ Q2）13（第一季）13（第二季）l1+l2（Q1）l1+l2（Q2）l2+l3（Q1） l2+l3（Q2） ATG（第一季度）ATG（第二季度）ATG10.2850.1420.4280.4280.1420.4280.4280.5710.2850.4280.4280.5710.71420.4280.2850.4280.5710.2850.2850.5710.7140.2850.2850.5710.8570.85730.1420.1420.2850.4280.2850.4280.4280.5710.2850.1420.4280.5710.71440.2850.1420.4280.5710.2850.2850.7140.8570.2850.4280.7140.8570.85750.5710.4280.7140.7140.4280.4280.8570.8570.4280.5710.8570.8571.060.4280.2850.5710.5710.4280.4280.7140.8570.4280.4280.8570.8570.85770.2850.2850.4280.5710.4280.2850.7140.7140.4280.5710.7140.7140.85780.2850.1420.4280.4280.2850.2850.7140.8570.4280.2850.7140.8570.857在一周的某些日子里有工作因此，任何个性化推荐系统都必须考虑所有ATG以提供有意义的功效。此外，图3示出了活动的时间定量和定性分数，并且每个活动的这些分数的差异清楚地示出了对于智能推荐系统的活动的分离的需要还可以基于用户的时间活动模式对用户进行分类，并且分析针对所执行的活动的一致时隙可以提供更好的分类准确度。最后，事实证明，嵌入式时间分析比时间分辨率分析更能提供信息。因此，存在一个强有力的理由来表示活动序列的时间关系的基础上，它们之间的层次5结论在本文中，已经提出了一个概念性的框架，在个人层面上使用纯粹的时间信息模型的流动性状态和活动模式，并产生流动性配置文件的最佳方式。这样的框架是任何上下文感知应用程序提供的核心，其利用时间信息来支持各种个性化活动。在未来，这可以扩展到通过随机或基于机器学习的方法使用他们的当前（或过去）活动状态和时间信息来预测下一个活动状态和用户分类。然而，这个研究方向的最终目标是建立一个个性化的推荐系统，该系统将能够随着时间的推移学习活动模式，并根据活动上下文提供警报。它已被证明，所提出的层次表示的活动将是有益的和翔实的这样一个上下文感知的推荐系统。引用[1] 于正。轨迹数据挖掘：概述。 ACM Transactions on IntelligentSystems andTechnology（TIST），6（3）：29，2015.[2] Yu Zheng，Lizhu Zhang，Xing Xie，and Wei-Ying Ma.从gps轨迹中挖掘有趣的地点和旅行序列。第18届国际万维网会议，第791-800页ACM，2009年。[3] Chaoming Song，Zehui Qu，Nicholas Blumm，and Albert-László Barabási.人类流动性的可预测性的极限。Science，327（5968）：1018[4] Juanjuan Zhao，Qiang Qu，Fan Zhang，Chengzhong Xu，and Siyuan Liu.海量智能卡数据中乘客出行模式的时空分析 IEEETransactions on IntelligentTransportation Systems，2017。[5] Shreya Ghosh和Soumya K Ghosh。基于gps轨迹的人体运动行为知识建模用于移动用户分类在第26届国际会议上万维网伴侣，第51-58页。国际万维网大会指导委员会，2017年。[6] Shreya Ghosh和Soumya K Ghosh。Thump：对轨迹进行语义分析，探索人体运动模式。在第25届国际会议上万维网，第35国际万维网会议指导委员会，2016年。[7] Quannan Li，Yu Zheng，Xing Xie，Yukun Chen，Wenyu Liu，and Wei-Ying Ma.基于位置历史的用户相似性在第16届ACM SIGSPATIAL国际会议上，地理信息系统的进展，第34页。ACM，2008年。[8] 吴伦，叶芝，隋正伟，刘宇。城市内部人员流动和活动转型：来自社交媒体签到数据

下载后可阅读完整内容，剩余1页未读，立即下载