没有合适的资源?快使用搜索试试~ 我知道了~
15010我会回来的:关于移动活动追踪应用程序用户的多个生命周期0Zhiyuan Lin斯坦福大学zylin@cs.stanford.edu0Tim Althoff 斯坦福大学althoff@cs.stanford.edu0Jure Leskovec斯坦福大学jure@cs.stanford.edu0摘要追踪运动、睡眠和饮食等活动的移动健康应用程序正在广泛使用。虽然这些活动追踪应用程序有助于改善我们的健康,但用户参与和保留对于其成功至关重要。然而,对于现实世界活动追踪应用程序中的长期用户参与模式尚不完全了解。在这里,我们研究了一个移动身体活动追踪应用程序中的用户参与模式,该应用程序包含了超过一百万用户在31个月内记录的1.15亿个活动。具体而言,我们发现超过75%的用户在长时间不活动后会返回并重新参与应用程序,无论不活动的持续时间如何。我们发现一个令人惊讶的结果,即重新参与的使用模式类似于初始参与期的开始,而不是简单地延续初始参与期的结束。这一证据指出了用户参与的多个生命周期的概念模型,扩展了当前普遍的单一生命周期的用户活动观点。我们证明了这些多个生命周期的发生是因为用户对使用应用程序有各种不同的主要意图或目标。这些主要意图与每个生命周期的持续时间以及用户重新参与新生活的可能性有关。我们发现用户更有可能在实现他们的主要意图或目标(例如减肥)后停止使用应用程序。然而,一旦他们的原始意图重新出现(例如想要减掉新获得的体重),这些用户可能会返回。我们讨论了多个生命周期范式的影响,并提出了一个新的预测任务,即预测用户的生命周期数量。基于本研究中开发的见解,包括改进的主要意图性能的标志,我们的预测模型达到了71%的ROCAUC。总的来说,我们的研究对于建模健康活动追踪应用程序中用户的重新参与具有重要意义,并对如何使用通知、推荐以及游戏化来增加参与度产生了影响。0ACM参考格式:Zhiyuan Lin,Tim Althoff和JureLeskovec。2018年。我会回来的:关于移动活动追踪应用程序用户的多个生命周期。在WWW2018:2018年Web会议上,2018年4月23日至27日,法国里昂。ACM,纽约,美国,11页。https://doi.org/10.1145/3178876.318606201 引言移动健康的活动追踪应用程序已成为人们日常生活中的重要组成部分。美国一项全国性研究在0本文以知识共享署名4.0国际许可证(CC BY4.0)发表。作者保留在其个人和公司网站上传播作品的权利,并附上适当的归属。WWW2018,2018年4月23日至27日,法国里昂©2018IW3C2(国际万维网会议委员会),根据知识共享CC BY 4.0许可证发布。ACM ISBN978-1-4503-5639-8/18/04..https://doi.org/10.1145/3178876.318606202013年的一项研究发现,69%的美国成年人会追踪一个或多个健康指标,包括体重、饮食、锻炼或症状,其中21%的人使用移动应用或设备进行追踪[17]。全球移动健康市场预计到2025年将增长到超过5000亿美元[44]。了解用户如何使用移动活动追踪应用程序可以显著改善人们的健康,例如通过预防负面健康结果和促进健康行为的采纳和维持[4, 30,43]。然而,对这些活动追踪应用程序中用户参与模式的理解,特别是在长期和大规模的情况下,尚不清楚。虽然在各种在线环境中已经进行了大量关于用户参与的研究(例如[12, 24, 31, 32, 36,37]),但目前尚不清楚用户如何参与和重新参与捕捉他们在现实世界中的离线生活的活动追踪应用程序。了解这些现实世界环境中的用户参与对于帮助人们改善健康尤为重要。随着追踪各种健康指标和日常活动的移动健康应用程序越来越受欢迎,对这些应用程序中用户参与的建模和理解变得重要。典型的用户参与建模通常认为用户在平台上有一个“生命周期”,在这个生命周期中,用户通常会越来越不参与[11, 13, 15, 22, 45,48]。这种单一生命周期的概念模型已经广泛应用于用户建模和参与研究,以及旨在增加用户参与的干预措施[5, 9-11, 13, 22,45]。例如,现有的工作已经集中在预测用户单一生命周期的持续时间[15, 21, 23, 46],并试图延长用户的生命周期以保留他们[6,48]。通常情况下,一旦用户长时间不活跃,他们就很难再回来,因此被认为是“死亡”[25]。生存建模技术已经应用于用户建模[16,21,23],也假设一旦用户“死亡”,他们就不会再回来重新参与应用程序。然而,在追踪现实世界行为的活动追踪应用程序的背景下,用户参与模式可能不遵循这种单一生命周期模型。用户可能在长时间不活动后重新参与应用程序,并以此开始新的生活。对于用户在长时间不活动后如何重新参与活动追踪应用程序,以及这种行为背后的机制以及这种行为是否可以提前预测,我们对此了解有限。本研究在移动活动追踪应用程序中进行了大规模的观察性研究,展示了在31个月内由超过一百万用户记录的1.15亿个活动中,超过75%的活跃用户在长时间不活动后会返回应用程序。这种行为与不活动的持续时间无关,并且通常用户会多次返回应用程序。虽然许多应用程序使用通知和电子邮件来恢复0论文集:物联网、移动和普适计算WWW 2018,2018年4月23日至27日,法国里昂15020用户在短暂的不活跃期后(例如几天),我们观察到有很大一部分用户在较长的时间后(例如90天)返回。重要的是,当重新使用应用程序时,用户的使用模式与用户初始参与期的开始阶段相似,不能简单地解释为初始参与期的结束阶段的延续。这些观察结果表明了用户参与的概念模型,即展示了多个生命周期,用户在重新参与后的活动与之前生命周期的开始阶段更相似,而不是结束阶段。用户在长时间不活跃后重新参与此应用程序,开始一个新的生命周期,而不是继续之前生命周期的模式 -通常是一次又一次。这种多生命周期的范式与现有用户生命周期建模的单一生命周期范式形成对比。尽管应用程序中有各种可用的活动,但我们发现用户通常专注于记录单一主要活动,反映了用户的目标或主要意图。我们展示了多个生命周期的发生是因为用户对使用移动健康应用程序有不同的主要意图。虽然每个用户的主要意图不同,但在同一用户的多个生命周期中,这些意图相对稳定。主要意图决定了每个生命周期的持续时间以及用户再次返回开始新生命周期的可能性。与用户的意图相关的是性能目标,如减轻体重、更多地步行或跑步,或者睡眠时间更长。我们证明,接近或达到这些目标的用户更有可能停止使用应用程序;也就是说,对他们来说,应用程序已经实现了其目的。然而,用户经常在长时间不活跃后以较低的性能水平重新参与(例如,体重再次增加),可能是遭遇挫折或设定新目标后;也就是说,应用程序可能再次成为追求旧目标或新目标的有用工具。我们进一步证明,用户重新参与可能受到外部和季节性因素的驱动,例如一月份的新年决心,以及夏季用户可能更感兴趣进行体育活动和减肥。多个生命周期的模式也因用户的人口统计特征而异。例如,我们发现年轻用户的生命周期要短得多,而且再次返回开始新生命周期的可能性较低。为了展示我们观察结果的预测能力,我们还制定了一个新颖的预测任务,即预测用户将有多少个生命周期。我们证明,本研究中开发的见解使我们能够以71%的ROCAUC预测用户是否重新参与另一个生命周期。我们还展示了与用户的主要意图相关的性能改进是即将离开应用程序的标志,因为他们的主要目标可能已经实现。虽然我们在一个单一的移动活动跟踪应用程序中展示了多个生命周期的范式,但我们的概念模型可能适用于其他移动健康应用程序,特别是当用户可能正在追求、达到和重置目标时。总的来说,我们对多个生命周期范式的发现对于提高活动跟踪应用程序的用户参与具有重要意义。例如,早期识别主要意图可以实现更具吸引力的个性化用户体验和更好的通知或游戏化体验。此外,认识到某些使用意图导致生命周期较少且较短的情况可以突出显示当前应用程序中支持不足的体验。此外,与许多但非常短的生命周期相关的意图可能成为吸引用户回归的主要目标。0数据集统计信息0观察期为31个月,从2013年7月至2016年1月 # 总用户数1,329,767# 总签到次数114,947,892 平均活跃期数( δ = 30天)1.7平均非活跃期持续时间( δ = 30天)102.3天 平均活跃期持续时间(δ = 30天)22.4天 年龄中位数32岁 % 女性用户48.5% %体重不足(BMI < 18.5)4.2% % 正常体重(18.5 ≤ BMI <25)43.6% % 超重(25 ≤ BMI < 30)31.0% % 肥胖(30 ≤BMI)21.3%0表1:数据集统计。2 多个生命周期的存在在本节中,我们描述了我们从一个活动跟踪应用程序中获得的数据集,并证明用户与应用程序的互动被分割成具有不同特征的多个不相交的活跃期。02.1 数据集 我们使用一个移动活动跟踪应用程序Argus by Azumio[5, 7,38](表1)进行观察性研究。这个智能手机应用程序允许用户跟踪各种日常活动,包括跑步、步行、有氧运动、心率、体重、睡眠、饮食和食物记录活动(该应用程序还支持其他更少使用的活动,如测量压力或记录瑜伽,我们将其聚合并称为“其他”活动;总日志量不到总量的2%)。例如,饮品活动用于跟踪用户的每日液体摄入量,锻炼活动用于记录各种室内运动,如举重或室内骑行。此外,该应用程序通过手机的加速计被动记录步数,并自动推断用户的卡路里消耗。然而,我们不将被动记录的活动视为积极参与,并因此过滤掉这样的数据。我们专注于使用该应用程序至少一周的用户。我们最终的数据集1包括超过一百万名用户在31个月的时间内积极记录了1.15亿次签到(表1)。这个长时间的观察期和大规模的数据使我们能够研究用户长时间不活跃后重新参与的模式。由于该应用程序的流行,其用户在年龄、性别、体重状况、原籍国和其他特征方面相对多样[7]。02.2 多个生命周期首先,我们证明用户与应用程序的互动被分割成多个不相交的活跃期。我们将活跃期定义为连续用户签到之间最多δ天的最大段。如果用户在至少δ天内没有记录活动,我们将其称为不活跃期。两个连续活跃期之间的不活跃期根据定义比δ天长。我们使用“(不)活动指数”来指代用户的第n个(不)活跃期。我们将活跃期的持续时间定义为该期间第一次和最后一次签到之间的天数。我们只考虑总寿命为λ天的用户,其中λ>δ,这样在给定的阈值δ下,用户至少理论上可以有多个活跃期。否则,01 所有分析的数据都是现有的和去标识化的。我们也获得了必要的IRB批准。0Track: Web of Things, Mobile and Ubiquitous Computing WWW 2018, April 23-27, 2018, Lyon, France15030(a) 每个用户的活跃期数量的CCDF。0(b) 不活跃期的持续时间。0(c) 活跃期的持续时间。0图1:用户有多个活跃期。(a)76%的用户在长达δ=30天以上的不活跃期后重新参与应用程序,进入第二个或更多的活跃期。(b)连续活跃期之间的间隔(不活跃期)随时间缩短。(c)活跃期随时间缩短。CCDF指的是补充累积分布函数。0根据设计,我们会获得一个对用户活跃期数的低估。结果显示,超过75%的用户(总寿命λ>30天)在长达δ=30天的不活跃期后再次变得活跃(图1a)。而且这些用户经常多次返回到应用程序。例如,59%的用户至少有三个活跃期,每次都在应用程序中缺席了δ=30天以上。重要的是,这种动态并不依赖于不活跃间隔δ的定义。即使用户离开了δ=90天,我们发现58%的用户会返回至少一个活跃期。因此,即使对于非常大的不活跃阈值δ,用户也有多个活跃期,这不仅仅是δ值较小的一个假象。我们强调,无论特定的不活跃阈值如何,大多数用户都会返回并有多个活跃期。因此,研究多个活跃期不会限制我们只研究人群的一个小样本,事实上,它与绝大多数用户相关。我们注意到,许多应用程序在用户短暂不活跃期后使用通知和电子邮件来重新获得用户的注意力(例如,几天)。然而,我们观察到很大一部分用户在更长时间(例如,90天)后返回,而这些用户通常在实际上被认为已经“死亡”。在接下来的研究中,除非另有说明,我们使用δ=30天。我们发现,随着每个额外的活跃期,活跃期和不活跃期的持续时间都会减少,如图1b和1c所示。第一个活跃期的平均持续时间为24天,第一个0(a)第一周和最后一周的签到次数。0(b)不同活动的数量0图2:用户在活跃期开始时有频繁且多样化的签到,但在活跃期结束时签到次数较少且多样性较低。当他们在另一个活跃期重新参与应用程序时,签到次数再次变得更频繁且多样化。所有图中的误差棒对应于自举法得到的95%置信区间。这里它们太小而无法看到。0并且第二个活跃期长达114天。请注意y轴的对数刻度以及所有曲线的部分线性行为。这表明无论是非活跃期还是活跃期的持续时间分布都可以近似为指数分布。多个活跃期只是一个单一、长期、碎片化生活的片段吗?我们将用户活动的两个简单度量标准视为用户活动的两个简单度量标准:每周签到次数和每周不同活动的数量作为多样性的度量标准。(当使用活动分布的熵或最频繁活动的签到比例时,我们得到类似的结果。)在图2a中,我们绘制了每个活跃期的第一周和最后一周的每周签到次数,并用一条线连接起来。图2b显示了每周不同活动的数量。在这两个图中,我们观察到一个“之”字形的模式,表明用户每个活跃期的开始时签到次数比上一个活跃期结束时更多,引入了行为的不连续性。此外,这些签到也更加多样化。用户在每个活跃期结束时也变得更不活跃,并且专注于比活跃期开始时更少的活动集。重要的是要注意,新活跃期开始时的使用模式与上一个活跃期结束时的使用模式相似,而不仅仅是上一个活跃期结束时的延续。这一观察表明,实际上应该将用户的活跃期分开考虑,而不是将它们视为用户的一个单一、长期、碎片化的生活。我们观察到这种模式适用于各种潜在的δ值范围,这进一步支持了这一观点。我们的发现指向了一种非常有趣的用户参与健康活动跟踪应用的模式。我们观察到大多数用户的生命周期可以分为多个活跃期(平均持续时间为24天),并且这些活跃期之间有长时间的不活跃期(平均持续时间为114天)。此外,我们观察到用户经常在长时间的离开后返回,并且他们的活动不是前一次使用模式的延续,而是看起来像是第一次使用该应用程序(图2)。从概念上讲,这与“多个生命”隐喻是一致的,用户离开应用程序,长时间不活跃,然后以新用户的身份返回。因此,我们将使用“生命”来指代一个个体的活跃期,使用“生命周期”来指代一个活跃期的持续时间,使用“生命指数”来指代用户的第n个活跃期。0Track:物联网、移动和普适计算WWW 2018,2018年4月23日至27日,法国里昂15040图3:不同用户群体的不同生命周期中用户重新参与新生活的概率。0期。在本文的其余部分,我们将展示这种多个生命范式如何影响健康跟踪应用的使用2。总用户生命周期与生命次数之间的关系。我们观察到总用户生命周期与生命次数(活跃期)之间存在关系。图3显示了根据上一个生命的持续时间重新参与另一个生命的概率。在第一个生命(蓝色曲线)中,我们观察到一个明显的U形关系,非常短和非常长的第一生命与多个生命的概率较小相关。在后续的生命中,这种U形关系减弱,短生命与最高的返回率相关。第一个生命非常短的用户不太可能返回,因为他们可能没有发现该应用程序非常有用。然而,在后续的生命中,短暂的生命并不意味着同样的事情——用户更频繁地返回,并且很可能在之前的使用中找到了价值。绝大多数用户存在多个生命周期模式,这表明虽然用户停止定期使用应用程序,但他们也经常返回,这表明在某些时候应用程序对用户是有价值的。03为什么会有多个生命周期?接下来,我们阐明为什么会有多个生命周期以及用户离开和返回多次的机制是什么?我们证明了跨多个生命周期的参与模式会根据用户的主要意图和外部影响而变化。03.1 多个用户意图使用此研究中研究的活动跟踪应用程序的用户使用该应用程序的意图各不相同。例如,一些用户可能想减肥,并定期使用该应用程序跟踪体重变化。其他人可能想更加积极地参与体育活动或改善睡眠质量。我们首先正式定义用户意图的概念,并且稍后将展示它如何解释用户如何使用应用程序以及为什么他们的参与模式会有多个生命周期。根据实证研究,我们发现大多数用户以非常专注的方式使用该应用程序,只使用少量不同的活动。具体而言,对于87%的用户来说,只需一个活动就足以覆盖50%的签到次数(图4;绿线)。对于一半的用户群体来说,只需两个活动就足以覆盖90%的签到次数(蓝线)。02当然,我们也可以将活跃期间简单地视为单个、长期的、碎片化的用户生命周期的片段。然而,我们预期在活跃期间之间的使用模式是连续的,但事实并非如此。相反,我们观察到整体用户生命周期被分割成活动期间和长时间的非活动期间。0图4:覆盖用户特定签到比例所需的活动数量。用户倾向于专注于很少的活动。例如,对于87%的用户来说,一个活动就足以覆盖50%的签到次数(不一定是每个用户的相同活动)。0图5:关注每个主要活动的生命周期比例。请注意,用户追求各种各样的主要活动。0由于应用程序的使用集中在很少的活动上,我们可以将每个用户的主要活动(即最常用的活动)作为用户使用应用程序的主要意图的代理。主要活动因用户而异。如图5所示,约三分之一的用户使用该应用程序来跟踪饮水情况(即监测水、咖啡因或酒精摄入量)。五分之一的用户主要跟踪心率(例如,锻炼后或休息状态下的心率;这两者都是心血管健康和健身的指标)。我们观察到其他用户主要跟踪体重(通常是为了减肥)、跑步、散步或睡眠模式。少数用户主要关注食物记录和有氧活动。03.2 用户意图和多个生命周期0用户在未来的生命周期中是否保持其主要意图?我们计算每个用户和生命周期中用户最常记录的活动(即主要活动),以及用户在连续生命周期中保持其主要活动的可能性。如图6所示,我们发现用户在生命周期之间大部分时间保持其主要活动,从第一个生命周期的约50%到第五个生命周期的近70%(蓝色曲线)。用户的主要活动与第一个主要活动匹配的概率约为50%(绿色曲线)。这些概率明显高于连续一致性。0主题:物联网、移动和普适计算 WWW 2018,2018年4月23日至27日,法国里昂15050图6:在下一个生命周期中保持相同主要活动的概率从第一个生命周期的49%到第五个生命周期的67%(蓝色曲线)不等。因此,大部分时间,用户在生命周期之间保持相同的主要活动。在第一个生命周期中具有相同主要活动的概率在47%到49%之间(绿色曲线)。0图7:用户的主要活动会影响平均寿命和返回概率。0基于以均匀随机方式选择九种可能活动之一(红色曲线)。这些发现表明,用户通常以与之前相同的主要意图“复活”,而不是在连续的生活之间改变他们的意图。然而,请注意,下一个生活中的使用模式不仅仅是前一个生活的延续,而且显示出新生活的独特迹象,如第2.2节所讨论的。多生活模式根据主要意图而异。我们发现用户使用应用程序的方式因用户的主要意图而异。图7显示了用户的平均生命周期(以周为单位)在x轴上,再次返回的概率在y轴上,根据用户的主要意图(在这里,我们只考虑至少有10次签到的用户生活,以减少噪音)。根据实证,我们发现主要记录心率的用户最有可能重新参与(52%)。主要记录跑步和睡眠的用户返回的可能性较小,但他们的平均生命周期几乎是主要记录心率用户的两倍(14.4、14.4对比8.7周)。这表明心率测量在某些时候被使用,但大多数用户在长时间内不会监测它们。相反,跑步和睡眠记录者似乎发现相关功能(GPS轨迹、时间和速度统计;睡眠时间、持续时间和质量)在较长时间内有用。饮食记录和食物记录等活动与生活较少且较短有关。另一方面,步行和体重记录活动与更多和更长的生活有关,这表明用户通常长时间地发现这些功能的价值。我们在第6节讨论了基于主要意图的多生活模式的设计启示,以增加用户参与度。0(a)每个生活中第一次和最后一次记录的体重。0(b)每个生活中第一次和最后一次记录的跑步持续时间。0(d)每个生活中第一次和最后一次记录的睡眠持续时间。图8:体重(a)、跑步(b)、步行(c)和睡眠持续时间(d)的平均第一次和最后一次记录值。我们发现,当用户即将停止使用应用程序时,他们的体重较低,跑步、步行和睡眠持续时间较长。然而,当他们重新参与时,他们记录的体重较高,跑步、步行和睡眠持续时间较短。这表明与更多和更长的生活有关的步行和体重记录活动与用户通常在较长时间内发现价值。我们根据主要意图中多生活模式的异质性讨论了基于此的增加用户参与度的设计启示。03.3 以意图为导向的性能驾驶多个生活与用户的主要意图相关联,具体的性能目标也会有所不同。例如,记录体重的用户通常对减肥感兴趣,记录跑步或步行的用户通常对持续时间或速度感兴趣,记录睡眠的用户通常对睡眠时间或质量感兴趣。我们假设一旦用户在与其主要意图相关的目标上取得显著进展,他们可能会停止使用应用程序。此外,这些用户可能会在有新目标要实现时重新使用该应用程序。为了测试这个假设,我们选择了四个在应用程序中报告的与性能相关的量(图8):体重活动使用减肥的公斤数,跑步活动使用分钟为单位的跑步持续时间,步行活动使用分钟为单位的步行持续时间,以及睡眠活动使用小时为单位的睡眠持续时间(数值越高越好,除了体重,因为大多数用户超重或肥胖;表1)。我们测量了每个生活中第一次和最后一次记录的活动相关结果。此外,我们分别考虑了具有不同生活次数的用户群体,以便比较随时间不变的人口。0Track: 物联网、移动和普适计算 WWW 2018,2018年4月23日至27日,法国里昂15060结果\主要活动权重 跑步 步行 睡眠0体重变化(公斤)-7.5*** -3.9*** -5.2*** -1.4***跑步持续时间(分钟)1.3 0.3*** 2.00* 0.0步行持续时间(分钟)23.7*** 21.8*** 42.0*** 22.8***睡眠持续时间(小时)0.4*** 0.7*** 0.5** 0.2***0表2:专注于特定活动的用户往往改善与该活动相关的结果(例如,主要是步行者增加步行时间,但也倾向于减肥)。每列是不同的用户群体,对应于相应的主要活动。行对应于不同的结果测量。使用Wilcoxon符号秩检验来测试显著性(* p < 0.05,** p < 0.01,*** p <0.001)。结果。我们展示了与体重(图8a)、跑步(图8b)、步行(图8c)和睡眠活动(图8d)相关的平均活动结果,不同颜色的用户组具有不同数量的总生命。在这四个图中,我们观察到一个“之字形”模式,用户在开始新生活时的表现水平低于结束时的表现水平;也就是说,体重减少,跑步时间增加,步行时间增加,睡眠时间增加。此外,我们发现,在用户返回应用程序时,他们的表现水平再次降低(例如,重新增加体重或缩短跑步/步行/睡眠时间)。当我们只关注每种活动的主要用户时,我们得到非常相似的结果。这表明在实现这些性能目标方面取得重大进展与离开应用程序有关,这种情况下,应用程序可能已经为该特定用户实现了其目标。然而,用户可能设定新的目标或遇到挫折(例如,体重增加或健康水平下降),给他们一个返回活动跟踪应用程序的理由,这可能在以前帮助他们实现目标。然后,该应用程序再次变得有用,以改善某个领域的性能。我们注意到图8中的“之字形”模式,用户在改善表现后离开应用程序并返回时表现下降,提供了用户参与这种活动跟踪应用程序确实分为多个生命的额外证据。用户通常改善主要活动的表现。在这里,我们提供了额外的证据,即专注于某种活动的用户倾向于改善与该活动相关的表现结果(表2)。具体而言,用户在主要步行者上的步行时间上改善最多(42分钟)。对于主要记录体重的用户,我们发现这些用户最后记录的体重平均比他们最初记录的体重低7.5公斤。与专注于不同主要活动的其他群体相比,这些用户减肥最多。我们注意到活动也是密切相关的。例如,主要记录体重不是应用程序用户减肥的唯一方法。事实上,我们发现主要是步行者和主要是跑步者也记录了显著的减重(分别为-5.2公斤和-3.9公斤)和增加的睡眠时间(分别为0.5小时和0.7小时)。这凸显了相互关联的活动和健康行为的复杂性,其中一些活动可能取代另一些活动,而其他活动甚至可能进一步支持彼此和与它们相关的目标(例如,跑步和步行增加的身体活动可能支持减肥)。总体而言,我们发现用户倾向于改善与其主要意图相关的表现结果,并且用户可能0图9:在第一周内进行更多不同活动的用户寿命更长。0图10:用户主要在一月份(超过平均比例6%)和夏季月份(超过平均比例14%)开始新的生活,可能与新年决心和夏季相关的活动和减肥目标有关。0然后离开应用程序。进行更多不同活动的用户寿命更长。我们刚刚观察到,例如,主要专注于跑步或步行的用户也记录了较大的体重减轻。直观上,这是有道理的。为了减肥,一个人需要做的不仅仅是记录体重。相反,一个人需要通过锻炼增加能量消耗或通过食物和饮料减少能量摄入。记录多种活动可能是对健康更感兴趣的标志,或者是支持特定健康目标的预期行为变化的标志。在这里,我们测试了这样一个假设,即具有更多不同活动集合(例如,跑步和体重而不仅仅是记录体重活动)的用户在寿命持续时间上是否与不太多样化的用户不同。实证上,我们发现具有更多不同初始使用模式的用户寿命更长(图9)。03.4外部影响活动追踪应用程序跟踪的活动发生在真实的物理世界中。因此,它们受到真实世界实践和需求的影响。例如,可能有季节性的影响驱动用户的意图和目标。为了调查外部的季节性影响,我们考虑每个新用户生命,并计算每个月开始的生命数量(即,用户第一次开始使用应用程序或在长时间不活跃后返回应用程序)。我们以平均每月率为标准进行归一化。我们只考虑2014年1月至2015年12月之间的观察结果,以确保我们的观察期包括每个月的两个实例。结果。我们观察到新生命开始时间的分布明显不均匀(图10)。我们发现最多的新生命开始于1月(超过平均速率的6%)和6月。0Track: 物联网、移动和普适计算 WWW 2018,2018年4月23日至27日,法国里昂15070(超过平均速率的14%)。这些发现可以通过外部影响驱动用户意图来解释。例如,大多数用户来自美国和其他西方发达国家的北半球。在这些国家,新年决心通常在1月1日表达;这是一个传统,一个人决心改变不受欢迎的特质或行为,实现个人目标,或改善他们的生活。许多新年决心围绕着更加积极地参与体育活动或减肥,而有这些决心的用户可能会寻找活动追踪应用程序来支持他们。此外,人们通常在6月左右的夏季寻求减肥或更加积极地参与体育活动。在这个时候,天气对体育活动更加有利,用户可能会为了“泳装季”而试图减肥。新生命开始的时间模式表明,活动追踪应用程序的用户受到现实世界的实践和需求的外部影响。特别是在这个例子中,用户重新加入时间可能受到季节效应的影响。我们注意到,多个生命模式也随着年龄、性别和体重状况等人口因素而变化。例如,我们发现年轻用户的寿命要短得多,长时间不活跃后重新参与的可能性也要小于年长用户。我们将在第4节中利用这些相关性来预测用户是否会重新参与新的生命,并预测他们的寿命。04预测多个生命我们提出了一个新颖的预测任务,即预测用户将有多少个生命。本节利用先前描述的见解,包括改进的主要意图性能的标记,以预测用户是否会回来进行另一个生命。我们还预测给定生命的持续时间。我们证明,虽然用户重新参与模式存在很大的变异性,但本研究中研究的因素使我们能够成功预测用户是否会重新参与另一个生命(71%的ROC AUC)以及这个生命将持续多长时间(82%的ROCAUC)。我们注意到,预测任务旨在验证我们的实证发现。从我们的发现中得出的特征可能具有普遍适用性,可以捕捉其他类似应用程序中的多个生命。04.1 任务描述0未来生命预测。对于任何(已完成的)用户生命,我们预测这个用户是否会有额外的未来生命;也就是说,他们是否会在长时间不活跃后再次使用应用程序。这是基于本研究中引入的多个生命范式的新的预测任务。寿命预测。对于任何用户生命,在观察到前四周(w =28天)后,我们预测用户是否会成为短期用户(在接下来的m =30天内离开)或长期用户(生存时间超过n =183天)。这遵循Danescu-Niculescu-Mizil等人提出的设置[15]。在这个设置中,我们放弃生命周期在[w + m,n) = [58,183)天之间的用户,以增加类别之间的对比度。我们还对不同参数选择下的预测模型进行了评估,并发现我们的结果,包括各个特征的相对预测能力,对于广泛的参数范围都是稳健的。04.2实验设置请注意,这两个任务都被定义为二元预测任务。为了定义用户的生命周期,我们仍然使用δ =30(同样,我们发现其他δ选择的结果非常相似)。为了避免过早地对用户是否重新参与进行分类,我们只考虑在观察期结束之前完全完成的用户生命周期。具体而言,我们确保所有考虑的用户在观察期的最后180天内没有签到(这大于第一个生命周期之后的平均生命周期间隔,平均为114天,后续生命周期更短;参见图1b)。请注意,根据本文描述的重新参与模式的本质,一个人永远无法确定某个特定用户在180天后是否仍然会重新参与。但是,我们测试了各种其他阈值,并得到了类似的结果。总共,这给我们留下了1,267,897个用户生命周期,851,582个不同的用户进行预测。我们使用ROC曲线下的面积(ROCAUC)作为评估指标,并使用10折交叉验证进行估计。我们报告了梯度提升树模型的性能,并通过在训练数据上进行交叉验证来优化树的数量、树的深度和学习率。我们还尝试了逻辑回归和线性SVM模型,由于突出的非线性关系(例如,具有中等寿命的用户最有可能返回应用程序;图3),这些模型始终给出较低的性能。模型。我们定义了一系列具有不同特征集的模型,以了解哪些特征对未来生命周期和寿命的预测最具有预测性。我们对两个预测任务使用相同的特征。但是,在寿命预测中,我们仅从每个生命周期的前四周计算这些特征。如果特征缺失,我们将其补为零,并包括一个指示缺失的二元变量。(1)寿命:当前生命周期的寿命(第2.2节)。(当预测寿命时,我们排除此特征。)(2)使用模式:每周签到次数,不同活动的数量,活动分布的熵以及来自最常见活动的签到比例的周变化(第2.2节)。我们还将这些指标的周变化作为特征包括在内。(3)主要活动:指示用户最常见活动的分类变量(第3.2节)。(4)性能变化:作为改进的主要意图性能的标记,我们包括体重、跑步、步行和睡眠持续时间以及每个活动的签到次数的变化(第3.3节)。(5)人口统计学:年龄、性别和身体质量指数的三个分类变量(第3.4节)。(6)加入时间:用户的第一个活动与Argus应用程序在2013年7月上线之间的天数(第3.4节)。 (7)全部:所有特征的组合。04.3 结果0未来生命周期预测。预测用户在未来是否重新参与应用程序的准确性如图11所示,再次分别针对每个用户的第一到第五个生命周期。对于预测用户在第一生命周期之后是否重新参与,我们的使用所有特征的完整模型实现了71%的ROCAUC。请注意,随机基准线将实现0.50的ROCAUC。我们观察到所有特征组都具有显著的预测性能。此外,我们发现性能变化标记(第3.3节)预测用户重新参与的ROCAUC高达58%。此外,随着每个生命周期的增加,预测性能下降。0Track: 物联网、移动和普适计算 WWW 2018年4月23日至27日,法国里昂15080图11:未来生命周期预测性能。我们在每个生命周期结束时预测用户是否最终会重新参与。0图12:寿命预测性能。我们预测用户是否会很快离开或长期停留。0寿命预测。寿命预测的准确性如图12所示,再次分别针对每个用户的第一到第五个生命周期。我们的完整模型在第一生命周期中实现了82%的ROCAUC。我们再次观察到所有特征组都具有显著的预测性能。我们发现性能变化标记对寿命的预测性能比重新参与更具有预测性,ROCAUC高达72%(相比之前的58% ROCAUC)。同样,我们观察到对于后续生命周期,任务变得更加困难,完整模型的准确性在第五个生命周期的ROCAUC范围从82%到69%。讨论。在寿命预测任务中,使用模式和性能变化是区分长期用户和短期用户最具预测性的特征,因为高度参与的用户经常签到,也倾向于更长时间使用该应用程序(第3.3节)。在未来生命周期预测任务中,加入时间对于重新参与具有很高的预测性,因为它区分了早期采用者和晚期加入的用户,以及识别在特定月份加入的用户,包括那些有新年决心和夏季减肥目标的用户(第3.4节)。预测性能在后续生命周期中下降可能是由于后续生命周期中数据点较少(图1a)和更短寿命导致的噪声增加。0(图1c)。早期生活中的用户显示出更大的使用模式变化(图2)和性能变化(图8),这也可能有助于更好地预测早期生活中的用户是否重新参与以及这个生活将持续多久。我们的结果表明,本研究中描述的见解能够成功预测用户是否重新参与另一个生活以及这个生活将持续多久。这些模型可以用于识别适合的用户群体,可以通过额外的通知、电子邮件和激励措施来针对这些用户群体,这对于增加用户参与度和留存率具有重要的意义。05 相关工作0用户参与度。用户参与度被定义为“强调与在线应用程序交互的积极方面以及与该应用程序的交互时间更长和重复使用的愿望的用户体验质量[24]”。广泛的文献研究了如何通过主观(例如,自我报告)和客观的度量(例如,眼动追踪,鼠标移动)来衡量用户参与度[12]。在移动应用程序的背景下,通过通知的点击次数、看到通知之前的时间和使用时间来衡量参与度[29]。在这项工作中,我们使用简单的客观统计数据来操作用户参与度,基于与应用程序的交互频率。以前关于用户参与度的工作讨论了重新参与的概念,即用户中断使用几分钟或几小时[31,32]。许多研究是在短时间内进行的,这使得研究重新参与模式变得不可能。与短暂的使用中断相反,在这项工作中,我们研究了长时间不活动后的重新参与模式(例如,30-90天)。建模和预测用户参与度。以前的研究已经基于重复消费模式[11,13]、连续观看[45]和无聊和敏化之间的切换模式[22]对用户参与度进行了建模。用户使用特定应用程序的意图可以从用户的行为中预测[14,28],因为它受到他们的意图的强烈影响[2]。典型的用户参与度建模认为用户在一个“生命周期”中逐渐变得越来越不参与平台[15,48]。许多研究致力于预测下一次用户活动的时间[6,21,23]、总生命周期[15,46],通常使用生存建模技术[16,21,23]。在可穿戴设备和移动设备数据的背景下,用户参与度研究试图主动参与用户[33],推断用户的情绪[26],并提出健康行为变化的建议[19,20,34]。所有这些研究都假设用户参与度遵循单一生命周期的范式。增加用户参与度。以前的研究表明,通过通知[3]、包括徽章[9,10]、游戏化[8,18,20]和社交网络功能[5,20]的激励可以增加用户参与度。此外,了解用户的意图[14,28]可以帮助设计师提供不同的交互模式[39],提供更好的上下文帮助[40],以及个性化的搜索结果和推荐[41,42]。本研究。本研究在活动跟踪应用程序的背景下研究了长时间不活动后的用户参与度和重新参与模式。我们通过发现用户在长时间不活动后定期重新参与,将用户参与度结构化为多个生命周期,扩展了以前的工作(例如[1,5,7,27,35,38,47])。0跟踪:物联网、移动和普适计算 WWW 2018,2018年4月23日至27日,法国里昂15090具有不同特征的多个生命周期是由用户意图和外部影响驱动的。此外,我们提出了一个新颖的预测任务,即预测用户的生命周期数量。06 讨论与结论最后,我们以用户在多个生命周期中参与度的概念模型总结了我们的发现。我们还讨论了在这种情况下增加用户参与度的设计影响。06.1活动追踪应用中多重生命用户参与度的概念模型通过以下模型解释了所呈现的经验证据:(1)用户以特定的主要意图和相关目标加入
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- 保险服务门店新年工作计划PPT.pptx
- 车辆安全工作计划PPT.pptx
- ipqc工作总结PPT.pptx
- 车间员工上半年工作总结PPT.pptx
- 保险公司员工的工作总结PPT.pptx
- 报价工作总结PPT.pptx
- 冲压车间实习工作总结PPT.pptx
- ktv周工作总结PPT.pptx
- 保育院总务工作计划PPT.pptx
- xx年度现代教育技术工作总结PPT.pptx
- 出纳的年终总结PPT.pptx
- 贝贝班班级工作计划PPT.pptx
- 变电值班员技术个人工作总结PPT.pptx
- 大学生读书活动策划书PPT.pptx
- 财务出纳月工作总结PPT.pptx
- 大学生“三支一扶”服务期满工作总结(2)PPT.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功