基于自然语言处理的虚拟现实放松应用用户评论的混合方法研究

91 浏览量更新于2024-01-07 收藏 1.35MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

互联网干预24（2021）100370用户对虚拟现实放松应用有什么看法基于自然语言处理的在线用户评论的混合方法研究SimonFagernaésa，WilliamHamiltonb，NicolasEspinozac，AlexanderMiloffd，PerCarlbring d，Philip Lindnera，*a瑞典斯德哥尔摩卫生保健服务部卡罗林斯卡医学院临床神经科学系精神病学研究中心&b瑞典斯德哥尔摩MimerseGavagai，斯德哥尔摩，瑞典d瑞典斯德哥尔摩斯德哥尔摩大学心理学系A R T I C L EI N FO保留字：虚拟现实心理健康自然语言处理用户体验放松A B S T R A C T经济实惠的虚拟现实（VR）技术的出现激发了消费者和商业对VR放松应用的兴趣，VR放松应用已迅速发展成为数字市场上流行的非游戏类型。虽然实验室研究已经证明了VR放松对心理健康的有效性，但对用户如何体验这种类型的干预知之甚少，也没有研究调查过日常生活中普通用户对消费者版本的接受情况。研究已发表的用户评论提供了一个独特的窗口，以自然的用户体验，补充传统的定性方法，通过规避访谈研究的抽样偏差，并允许对完整的样本进行分析，不受编码资源的限制。使用创新的半自动自然语言处理技术，目前的研究分析了Oculus Go和Gear VR的30种不同VR放松应用程序的1379篇已发表评论（包括星级）。未被揭示的主题结构及其情感分析表明，用户对VR放松应用程序具有总体积极的看法，将其描述为成功地诱导沉浸和放松，并且欣赏游戏化元素。然而，感知质量差异很大的应用程序之间的解释更多的差异星级比具体功能。提出的关键问题都是技术性的（例如，“overheating”)对消费者设计的影响讨论了VR的应用和未来的研究1. 介绍虚拟现实（VR）是一种沉浸式技术，可以创造虚拟环境中的体验，目前通常使用头戴式显示器来实现，该显示器可以保留外部世界，连续测量头部旋转并相应地调整立体视图（Scarfe和Glennerster，2019）。除了游戏、沉浸式讲故事和其他流行的娱乐形式等应用外，这些虚拟环境还可以通过将治疗机制转化为 VR 体验来设计用于临床目的（Lindner，2020）。在其最简单的形式中，这涉及对环境或行为的虚拟模拟，否则在现实生活中出于相同的目的而执行。尽管在治疗上很简单，但这种虚拟场景仍然可以带来实质性的实际益处：例如，用于恐惧症的VR暴露疗法（Botella等人，2017年），解决了许多物流通过使暴露于另外不可用的刺激来提供暴露疗法的问题（Lindner等人，2017年，2020年a），允许定制刺激（里佐等人， 2010年，它完全可以控制。 VR暴露疗法已经通过许多荟萃分析显示是有效的（Carl等人，2018; Fodor等人，2018; Wechsler等人，2019年），新的研究已经证明了自动化，游戏化格式的功效（Donker et al.，2019，2020; Freeman等人，2018; Lindner等人，2020 b; Miloff等人，2019年），更广泛地利用技术固有的能力，例如，通过以具体化的虚拟治疗师为特征（Miloff等人， 2020年）。正如VR技术可以通过以沉浸式方式呈现恐惧刺激的虚拟等价物来诱导恐惧反应（实现暴露疗法）一样，它也可以通过将用户置于和平的虚拟环境中来诱导放松，通常描绘海滩和森林等自然环境。画外音说明* 通讯作者：Norra Stationsgatan 69，113 64 Stockholm，Sweden.电子邮件地址：philip. ki.se（P. Lindner）。https://doi.org/10.1016/j.invent.2021.100370接收日期：2020年8月14日;接收日期：2021年1月13日;接受日期：2021年2021年2月2日在线提供2214-7829/© 2021作者。由爱思唯尔公司出版这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）。可在ScienceDirect上获得目录列表互联网干预期刊主页：www.elsevier.com/locate/inventS. Fager naés等互联网干预24（2021）1003702可以增加呼吸和冥想练习，或简单和重复的运动或认知任务，以提供更积极的放松形式。依赖于放松的主观和客观测量的大量研究已经表明，这种方法确实诱导放松和/或降低压力（Anderson等人，2017; Anner-stedt等人，2013; Hedblom等人，2019; Serrano等人，2016; Valtchanov等人，2010年）。最近出现的负担得起的消费者VR技术，包括用于应用程序分发的成熟数字生态系统，代表了VR心理健康（包括VR放松）的可用性和可扩展性的范式转变。2016年发布的第一代VR应用程序在两年内拥有超过40，000名用户，尽管当时VR用户群非常有限，但揭示了有希望的公共卫生潜力（Lindner等人，2019年）。从那时起，VR放松已经成为应用市场上最受欢迎的非娱乐类别之一。压力（Bergdahl和Bergdahl，2002; Nordin和Nordin，2013）和其他心理健康问题的高人群患病率可以通过放松来缓解（Klainin-Yobas等人， 2015），结合相对简单的软-软件开发-定义360度自然的视频，舒缓的音乐和基本的用户间-脸除了关于VR放松的早期功效研究之外，我们还没有发现任何研究表明这种功效在普通用户在家使用时转化为现实世界的有效性，而不是研究环境。应用程序之间的内容和质量似乎存在很大差异，这也使得所有发布的应用程序不太可能共享相同的有效性和用户参与度。关于智能手机应用程序治疗抑郁症的相关研究（Larsen et al.，2019年; Shen等人，2015）表明，很少有商业VR放松应用可以预期是基于证据的，从而有效的。上述第一代VR放松应用程序的吸收和使用统计数据表明，重复使用者的程度较低，尽管缺乏个体数据无法得出明确的结论（Lindner等人，2019年）。此外，关于VR放松的用户体验的现有定性文献非常有限，特别是使用现在商业上流行的类型的应用程序的研究。最近的一项研究发现，主题来自对尝试VR正念范式的用户的采访，其中包括一个宁静森林的360度视频与正念练习以及更通用的VR方面有关，如可变和中断的存在感，个性化的需求，图形质量和头戴式显示器的重要性（Seabrook等人，2020年）。事实上，放松是在实验室环境中进行的，虚拟现实模式是明确的正念-聚焦和包含被动（即非交互式）360度视频而然而，比计算机生成的环境，提出了重要的问题，如何主题和含义推广到其他设置（即。e.在家里使用）和其他类型的放松环境和范例。目前的研究采用了一种新的方法来检查在研究背景之外使用VR放松应用程序的经验，以便为下一代此类应用程序的开发提供信息。通过挖掘和分析两种最流行的消费者VR设备的VR放松应用的公开在线用户评论，当前的研究通过调查相当大的用户样本来补充传统的深入定性研究（可能具有较小的抽样偏差），提供了最大的外部有效性的调查结果和良好的条件，以揭示更大的自动宽度。对用户评论的分析先前已用于对抑郁症的智能手机应用的研究（Stawarz等人， 2018），睡眠问题（Ajiet al.，2019）、体重减轻（Frie等人，（2017年）和药物依从性（Park等人，2019），以及VR exergames（Faric等人，2019年）。与以前的研究通常依赖于主观手动编码不同，我们使用了半自动自然语言处理（NLP）工具（Espinoza等人，2018）从自由文本数据中揭示主题结构。这使我们能够使用基于主题专业知识的可复制分析来分析可用评论的完整样本（由于编码资源有限，没有随机二次抽样）。该分析还通过在评论水平上的主题建模实现了协同定量分析，使我们能够计算应用程序和应用程序类型（例如主动与被动放松）之间的主题流行率，以及计算与附带星级评级的关联。基于更广泛的现存mHealth文献中的类似发现，我们假设用户的接受程度在应用程序之间会有很大的差异，无论是在星级和主题结构方面。2. 方法2.1. 伦理目前的研究仅使用每个法律主体公开的数据。这些数据可以在网上免费获取，根据瑞典立法中提到的GDPR第9条定义，其内容不被视为敏感。因此，本研究不适用于《瑞典涉及人类的研究伦理审查法》（2003：460），因此不需要进行独立的伦理审查。瑞典伦理审查机构确认了这一解释（2020-06678）。识别属性在尽可能早的阶段被删除。由于完整性和方法一致性的原因，结果中列出了术语（用于分析的数据水平），而不是完整的引用。2.2. 数据收集和预处理数据收集采用了多项入选标准。这项研究专门关注两种没有位置跟踪（所谓的3自由度）的移动VR设备的应用程序（Scarfe和Glenner-ster，2019）：Oculus Go和三星Gear VR。Oculus Go与Gear VR是双向兼容的，大多数应用程序都可以在不修改这两款设备的情况下启动。出于这个原因，尽管官方的Oculus市场有单独的Go和Gear VR部分，但两种设备上可用的应用程序的评论是合并的，并且在技术上不可能区分特定评论者使用的设备（除非在文本中明确提到）。出于几个原因，我们选择将我们的评论挖掘限制在Go和Gear VR的应用程序上。由于主题结构是在语料库级别上建模的包括使用具有位置跟踪功能的新设备的评论在Oculus Rift的情况下，也具有更大的图形功能此外，Go和Gear VR是最受欢迎的VR设备之一，并且已经上市多年（允许大量评论积累），没有或很少过去几年（分别）硬件的相关变化可能会在评审内容中引入混淆变化。重要的是，这两种移动设备的价格都是合理的，并且随着时间的推移价格稳定（Go成本约为240美元），从而在谁能负担得起购买一个方面引入了最小的抽样偏差。最后，这些设备具有多个流行的放松应用程序，可在官方市场上以不同和指定的应用程序类别下载，包括英语的自由文本评论，对于每个列出的应用程序，以1-5星（最低到最高）的形式提供数字评级。为了收集评论进行分析，开发了一个自定义Python脚本，用于挖掘所有已发布的评论（包括星级和当前评论），价格）的所有应用程序属于Oculus Go官方市场上的类别（入选标准）。只有Go市场被挖掘，因为这是两者中较新的设备，大多数应用程序都提供与Gear VR的向后兼容性（Gear VR的潜在应用程序S. Fager naés等互联网干预24（2021）1003703==-==-=但Go不被认为太老而不相关）。该脚本于2020-03-23运行，导致对K56应用程序的初始审查为n其中，属于k19应用的n 60篇综述由于发表的综述少于7篇而被丢弃：代替任何已建立的适用于此类分析的指南，7篇综述的选择是根据定性健康研究中观察到的典型最小样本量的结果指导的（Vasileiou等人，2018年）。其余的申请都是人工审核的，导致k 7申请（共n222次审核）被排除在外，因为尽管属于放宽类别，但主要不是放宽申请。这些被排除的应用程序中的大多数是非特定体验应用程序（未作为放松工具销售或在描述中提及此类组件）和/或主要是益智游戏.最终的预处理数据集包括k= 30个应用程序，其中k= 1214个用户发布的评论总数为n=1379，每个应用程序的评论范围为7-316，中位数为23.5。流程图见图1所有摘录和保留的评论均为英文。每个应用的评论数量的密度图见图2的面板A。每个评论的字符和单词的中位数分别为138和25;见图B。 2为直方图。不仅允许对单个应用程序进行分析，Fig. 1. 分析流程图。特征，最终的k 30应用程序由作者AM使用专门为此研究开发的新编码方案进行分类，以代替现有文献中VR放松应用程序的任何共识分类系统。该分类方案包括四个变量：类型（冥想或其他，例如游戏，运动或艺术），参与（主要是被动或主动），环境风格（自然或非自然，例如，自然或非自然）。G. psychedelic）和price（崩溃为免费或不免费）。最初考虑了两个额外的分类，但在分类过程中放弃了：sandboX特征和主要模态（音频或视频）。前一种分类由于难以确定定制选项的范围而被丢弃，而后一种分类由于大多数应用程序强调两种模式而被丢弃。纳入的应用程序描述见表1在导出用于NLP的预处理数据之前，应用程序和用户名通过替换为唯一的随机字母数字序列而被盲化。为了保持科学中立性，并且由于当前研究的目标是调查放松型应用程序的用户体验，而不是评价特定应用程序，因此结果中仅显示设盲应用程序名称2.3. 通过半自动自然语言处理进行将设盲的预处理数据集上传至Gavagai EX plorer网络界面。与其他NLP方法相比，该工具被明确设计用于使用逐步、增量的细化聚类结构和校正错误的过程的半自动化分析（Espinoza等人，2018年）。简而言之，Gavagai E X plorer通过估计语义空间中的相对邻域拓扑来执行词汇聚类（Gyllensten和Sahlgren，2015），在每次迭代中添加或建议同义词以基于多种语言中可用的在线分布式语义模型来增加主题覆盖率（Sahlgren等人，2016年）。假设措辞的选择反映了潜在的情感，并且词语因此承载了态度负荷，该方法还允许通过词汇计数和聚合来估计情感（由情感驱动的对某些事物的态度）（Karlgren等人，2012年）。在本研究中，使用共同的正负极性对个体评论进行分类（Fang和Zhan，2015）。分析管道首先自动生成初始模型集显示排名前30位的主题，主题排名基于数据中的出现次数。然后，作者SF迭代和逐步完善初始模型，以创建一个有意义的，全面的和浓缩的主题结构，其过程类似于主题分析中使用的过程（Braun和Clarke，2006）。在第一步中，研究者阅读了分配给每个初步主题的几篇评论，以熟悉主题，并根据主题名称和表达的内容之间的对应关系评估表面效度。表面效度手动评估的规模从1（低表面效度）到5（高表面效度）。在第二步中，评分为1的主题从模型中删除。在第三步中，为了减少主题的数量，共享高阶概念的主题被合并并重命名以捕获高阶概念。然后在步骤4中重复该过程。当两个主题合并时，Gavagai EX plorer工具会自动生成一个新的主题，该主题位于排名列表的最后。如果新主题被评估为与现有主题共享概念内容，则将其合并到现有主题中，否则将其保存为新主题。当自动生成的主题连续至少5次未被评估为新主题时，则认为主题结构饱和。最后，对属于每个主题的术语进行了仔细审查。被认为会降低该主题表面有效性的术语被省略。缺少同义词、拼写错误和/或补充术语在该工具的自动建议的帮助下，这对最终的主题结构和情感影响很小。S. Fager naés等互联网干预24（2021）1003704=图二、每个应用程序的评论数量分布，以及评论的字符和字数图A：每个应用的评论数量的密度图面板B：评论的字符（左）和单词（右）计数的直方图表1包括应用程序的分类名称Gear VR类型接合环境价大微风船是的其他活性自然不自由双耳波冥想是的冥想被动两不自由冷静是的冥想被动自然免费平静的地方是的冥想被动自然免费查克拉VR是的冥想被动不自然不自由奇美拉阅读器没有其他活性自然免费Claro没有其他活性不自然不自由宇宙流：一个放松的VR体验没有冥想被动不自然免费Deepak Chopra寻找真实的自我是的冥想被动不自然不自由经验松弛是的冥想被动自然不自由FlowVR冥想是的冥想被动自然不自由宁静森林是的冥想被动自然免费GoPaint是的其他活性两不自由冥想VR是的冥想被动自然免费引导放松VR没有冥想被动自然免费快乐的地方是的冥想被动自然免费Healium是的冥想被动两免费拼图360没有其他活性两不自由Liminal没有多活性两免费冥想VR是的冥想被动两免费自然之旅VR是的冥想活性自然不自由Paddle Ride EX perience是的其他活性自然不自由真正的VR钓鱼没有其他活性自然不自由放松与自然VR是的冥想被动自然不自由ShapeSpaceVR - Zen Parade是的冥想被动不自然不自由斯法尔斯未知冥想被动自然不自由特里普没有多两两免费世界没有多被动自然不自由VR教会：圣经是的多活性自然免费禅宗地带是的冥想两不自然不自由a数据挖掘时。奖品是应用程序下载2.4. 统计分析所有统计分析均在R 3.6.3环境中进行。使用以下方法检查了不同应用程序中每个单独主题和总体审查情绪的发生率差异气，平方检验，而星级评定中的应用程序之间的差异进行了检查，使用韦尔奇的F检验。使用单独的逻辑回归模型（预测总体评论情绪）或线性回归模型（预测星级）来检查每个特定主题的影响，同时控制其他主题的发生。最后，影响通过运行线性回归模型来检查应用程序功能类别的四个分类，获得同样的评级对于此分析，我们从10个应用程序中省略了k 229个评论，这些应用程序无法以二进制方式进行有效分类，例如，由于具有自然和非自然的虚拟环境。然后将该模型作为随机截距混合效应模型重新运行（Bates等人，2015; Kuznetsova等人，2017年），以检查在考虑应用程序层面的聚类后，功能类别之间是否仍存在任何差异，即星级评定的差异是否主要由功能或个别应用解释。S. Fager naés等互联网干预24（2021）1003705=-=-=-益智游戏，游戏3. 结果3.1. 话题结构使用NLP的半自动主题建模产生了八个最终主题：（49%的发生率）;沉浸感和/或VR相关的感官主题（42%）;技术相关的主题（38%）;放松和/或应用程序的目的（34%）;批评（19%）;游戏和游戏化（17%）;应用程序中的功能，种类和选项（16%）;以及价格（13%）。批评主题主要收集负面情绪，尽管技术相关主题也有很高的负面情绪流行率。其余主题主要表达了积极、中立或两者兼而有之的情绪，总体情绪评分为66%积极、18%中立和16%消极（在82%的评论中检测到情绪）。沉浸相关主题和放松相关主题都包括表明应用成功诱导放松的术语，非常积极的情绪。批评主题中包含的术语涵盖了技术（“过热”），设计（“令人毛骨悚然”）和使用（“无聊”）问题。涉及应用程序中的功能和各种选项的术语的主题出现率较低（16%），主要表现出积极的情绪，这表明这些功能在这些选项的应用程序中受到赞赏。游戏和游戏化主题的发生率也很低，但69%是积极的。完整结果见表23.2. 定量分析结果使用所有主题预测每个整体情绪的多元逻辑回归模型的结果与主题内情绪基本一致。一致地，四个主题正相关表2最后的主题结构。与星级评定负相关者3例，无显著相关者1例。参数估计值和比值比（包括百分之九十五信心间隔）从的多元回归模型星级评分在不同应用程序之间存在显著差异（Welch<<'s F 29，200 = 26.9，p 0.001），积极、消极和中性总体情绪的发生率也存在显著差异（分别为 ; 所有 p 0.001 ， χ 29 > 69.89 ）。除批评（p=0.173，χ29=36.0）外，所有主题的出现在应用程序中也存在显著差异（所有p0.003，χ29>54.19）。<完整结果见图4。在预测星鼠的普通线性回归模型中，从所有四个分类变量中，被动应用程序（B-0.74，SE0.18，p.001）和非自然环境（B<-0.52，SE 0.16，p 0.001）的评分较低，而类型和价格与星级评分无显著相关性（分别为p 0.21和p 0.57然而，当重新运行该回归模型作为随机截距混合模型（按应用程序聚类）时，没有预测因子保持显著性，随机截距占方差的29%。4. 讨论VR是一种不断发展的消费技术，放松应用程序-虽然从实验室研究中有越来越多的证据表明VR放松是有效的（Anderson等人，2017; Annerstedt等人，2013; Hedblom等人，2019; Serrano等人，2016; Valtchanov等人，2010）并受到用户的赞赏（Seabrook等人，2020），但是还没有研究这些应用在日常生活中是如何使用的，它们在现实世界条件下如何被用户观看，或者不同的应用特征如何与用户接收相关联。目前的研究通过挖掘此类VR的在线用户评论来解决这些关键的研究空白主题术语发生%消极情绪%积极情绪%中性情绪%该应用程序沉浸感和/或VR相关的感官主题技术相关主题放松和/或目的与应用程序批评App，experience，vr，new，apps，experiences，overall，application，experienced，general，all in all，applications，mobile app，experience，journeys，general experiance，comprehensive，thought，vr-experience，interactive音乐，图形，环境，环境，开发人员，外观，现实，场景，风景，外观，声音，视频，沉浸式，外观，场景，3d，视觉效果，360，devs，开发人员，图像，细节，风格，2D，照片，大气，动画，180，环境，风景，动画，日落，分心，照片般逼真，风景，设计，噪音，安静，照片般逼真，卡通，艺术风格，风景，海滩，设计，单视场，360度，无声，歌曲，动画工作，更新，下载，oculus go，尝试，安装，尝试，oculus，尝试，更改，工作，控制器，作品，下载，更新，设备，下载，卸载，工作，安装，更改，更改，安装，更新，尝试，重新安装，更新，重新安装，vr耳机，安装，重新安装，oculus rift，尝试，更改，安装，oculus go store，齿轮vr，卸载，卸载，控制器，禁用，游戏手柄放松，冥想，放松，放松，安静，平静，冥想，放松，和平，引导冥想，舒缓，重点，冥想，冥想，寒冷，帮助我，冥想，平静，呼吸练习，冷静下来，帮助，冥想，正念，减压，宁静，平静，平静，专注/放松，冥想室，放松时间，安静，帮助，安静，平静，自由漫游，宽松的时间，很大的帮助请，固定，坏，固定，失望，压力，失望，过热，烦人，相反，过热，避免，可怕的，无聊的，可怕的，不切实际的，解决，不够，毫无意义的，无用的，平庸的，请，解决，过热，沮丧，平淡无奇，失望，令人毛骨悚然，强调了，解决，wierd，困惑，不一致，好奇，过热，缺乏，蹩脚，愤怒，粗略，缺乏，令人不安，怀疑，混乱，焦虑，固定，不足48.87 10.97 69.43 19.5841.76 10.76 66.4937.95 42.1234.3 7.1819.36 48.31 24.71游戏和游戏化游戏，钓鱼，游戏，玩，鱼，玩，游戏，帆船，多人，16.96 6.83 69.23应用程序中的功能、多样性和选项选项，位置，选项，不同，接近，区域，品种，区域，附近，范围，选择，选择，变化，广泛选择，分类，不同类型，多样，不同风格16.31 11.55 54.22价格值得，买，钱，支付，购买，价格，购买，成本，便宜，定价12. 54 16. 18 35. 83 47. 97一包括语料库中出现的拼写错误的单词。=S. Fager naés等互联网干预24（2021）1003706图3.第三章。多元回归模型从主题预测星级和情绪。放松应用程序，通过半自动NLP提取主题，并检查主题，情绪和星级之间的统计关联。总之，我们发现，用户对这些应用程序有一个总体积极的看法，将它们描述为成功地诱导沉浸和放松，并具有许多值得赞赏的功能，如游戏化元素和定制放松体验的选项。然而，正如所假设的，在星级、评论情绪和主题方面，应用程序之间存在很大差异，这表明每个单独应用程序的质量比应用程序的特定方面（例如，提供的虚拟放松环境的类型）更重要。沉浸和放松相关的主题与表达的积极情绪和更高的星级相关，表明这些应用确实成功地诱导放松，重复了实验室研究的结果。然而，这些主题的出现在应用程序之间存在很大差异，星级评定也是如此，揭示了应用程序之间感知质量的巨大差异，并间接表明了有效性的差异。这反映了过去对消费者智能手机应用的研究，已经发现消费者智能手机应用在基于证据的治疗成分的使用方面差异很大（Shen等人，2015），直接经验支持（Linardon等人，2019）和使用科学语言来支持这些主张（Larsen等人，2019年）。VR放松应用程序感知质量的巨大差异可能部分源于这种特定类型应用程序的应用程序开发门槛较低，微创可行产品要求只 360 ◦ 视频的自然环境，舒缓的音乐和极简的用户界面。这激发了对该类型的商业兴趣，由于处方商业模式的承诺而变得更具吸引力，因为放松只能暂时缓解通常是慢性问题的问题;这与VR的其他临床应用形成对比，例如恐惧症的暴露疗法（Donker et al.， 2019; Freeman等人，2018; Lindner等人，2020 b; Miloff等人，2019年），预期在特定时间段内使用，之后症状预计或多或少永久减少（即不再需要应用）。虽然观察到的VR应用质量的变化并不令人惊讶，但考虑到智能手机应用的调查结果，开放评论和星级评级等市场机制此外，探索VR用户如何选择心理健康应用程序可以说是该领域未来的一个重要研究问题，应该使用帐户跟踪研究和定性研究来探索。事实上，用户接收应用程序之间的差异很大，评级的应用级聚类是可以考虑的，这使得难以得出关于哪些类型的特征被积极看待的一般结论，相反，这表明整体应用质量和用户体验比任何特定特征更重要。然而，第一次探索性研究的结果表明，VR放松应用程序的设计，这应该在未来的研究中进一步探讨的游戏和例如，游戏化主题具有总体低出现率，但在四个应用的评论中显示出现峰值（>50%），这四个应用也显示出高平均星级和积极情绪的高出现率。相应地，在评论层面上，这个话题与更大的积极情绪发生率和更高的星级评级相关，甚至在一个多元回归模型中，该模型考虑了其他主题的出现（然而，应考虑应用程序级别的聚类）。虽然这些分析做不直接对比游戏化与非基于独立分类的游戏化应用程序由于阈值处理的困难，该方面没有包括在分类方案中。对特定应用程序中包含的游戏化元素进行详细的比较案例系列描述超出了当前研究的范围，但我们观察到游戏化元素包括常见元素，如成就徽章，推广使用统计数据（例如完成的会话数量）和领导委员会（Koivisto和Hamari，2019）。以及围绕不需要身体活动（不利于放松）并且可以容易地游戏化的舒缓活动（例如钓鱼）来建立放松体验。应该注意的是，该主题所涵盖的具体术语集中在后者，并且在回归模型中，没有对应用程序的星级评定进行聚类，被动应用程序（即不是围绕游戏化的放松活动构建的）的评级较低。此外，这些元素在被审查的应用程序中的出现和实现存在很大差异，因此不适合就哪些特定的游戏化元素受到赞赏得出结论。尽管游戏化元素越来越多地用于数字心理健康应用，但特定元素的功效的证据很少（Johnson等人，2016年）。然而，先前关于精神VR干预的定性研究（Lindner等人，2020 c）和身体健康（Faric等人，2019年），以及非VR干预精神健康（奇克等人，2015），表明这些功能确实受到赞赏。我们的结果重复这些研究结果使用了补充方法，支持假说-这表明包括它们是有利的;代替直接的实验支持，可以假设所欣赏的特征通过促进参与和坚持来增加功效。市场良好的高质量消费者VR应用程序今天可能会在短时间内找到成千上万的用户（Lindner等人，2019），原则上允许以前所未有的规模对个体（游戏化）特征进行随机A/B测试和/或中断时间序列分析。这将提供力量来解开特定游戏化元素的即使是很小的影响。在产学合作中开展此类研究不仅在为用户提供迭代更有效的VR放松应用方面具有重要价值，而且在一般游戏化领域也具有重要价值。还需要进一步深入定性研究用户如何感知VR心理健康应用中的特定游戏化元素。S. Fager naés等互联网干预24（2021）1003707图四、应用程序之间的星级、情感和主题分布。同样，在现有的文献中，关于应用中的定制能力是否会导致更大的功效和/或参与度的问题缺乏明确的答案。目前的研究结果表明，虽然品种和选项显示出积极的主题内情绪，但它与任何情绪或星级无关这可能是一个该主题的总体低发生率的影响，当功能可用并使用时，用户在其评论中提及这些功能的总体低趋势（错误分类偏差），和/或应用程序之间在可用性、实现质量、应用程序内推广和实际使用程度方面的虽然没有明确的S. Fager naés等互联网干预24（2021）1003708从当前研究的结果中，可以得出关于这种特殊类型的功能的设计含义，现存的文献确实表明，以定制能力的形式扩展的功能可能是有利的。使用360度全景视频环境对VR放松进行的初步实验室研究表明，不同的自然场景具有不同的放松效果（Wang等人， 2019年）和更大的影响而不是城市环境（Hedblom等人，2019年）。此外，VR放松效应与对不同自然环境的偏好在某种程度上相关（Gao等人，2019年），尽管仍然不知道这种效应在人群和图形模式中的推广效果如何。此外，来自VR领域之外的间接证据强调了提供定制体验的重要性，例如，研究表明，如果音乐是个人偏好和选择的，则镇静和刺激音乐被发现同样令人放松，但当音乐不是非偏好时则不然（Jiang等人，2013年）。考虑到人们在哪种音乐和视觉环境中感到舒缓的差异很大，为用户提供定制他们的体验的选项提供了一种解决这个问题的方便方法，尽管这种方法的价值还有待于经验检验正如之前关于VR放松的定性研究（Seabrook等人，2020）和游戏化VR暴露疗法（Lindner等人，2020年c），出现了一些技术和使用方面的负面经验。引人注目的是，这个主题是唯一一个在不同应用程序中出现率没有显著差异的主题，总体主题出现率几乎为20%。虽然这项研究没有包括与其他类型的VR应用程序的批评发生率的比较，但我们的研究结果表明，相对较大的少数审查用户遇到的问题往往是相对简单的应用程序软件明智的。检查包含的术语可以发现用户报告安装过程中的问题，过热，更新导致应用程序损坏，或者对视觉呈现（“令人毛骨悚然”，“不切实际”）或游戏性（“困惑”）提出异议。使用者还报告了负面（与预期相反）影响（Rozental等人，2014），由诸如“压力”、“压力过大”、“焦虑“和“烦人”的术语表示。除了明显的小故障和bug（通过仔细编程可以在很大程度上避免），这些批评中的一些可能源于个人偏好，例如，完美的照片级逼真但被动的360度全景视频自然环境是否优于交互式卡通，看环境。同样，通过向用户提供各种环境，可以避免这种风险，从而潜在地降低很少有重复使用者的风险（Lindner等人，2019年），正如在智能手机应用程序中观察到的精神健康（Baumel等人，2019年）。深入的定性研究，以及积极诱导不同错误和故障的实验研究（Liebold等人，2017），将被要求检查不同的批评如何影响放松功效和随后的应用程序使用。有趣的是，我们发现与电脑病相关的术语的发生率很低（Kennedy etal.，1993），一种类似晕动病的状态，据信主要由视觉和前庭/本体感觉系统之间的感觉差异引起（Rebenitsch和Owen，2016），尽管视觉呈现、运动、持续时间甚至用户特征也起着直接或间接的作用（Saredakis等人，2020年）。考虑到最近硬件功能的改进（例如，更低的延迟，更高的分辨率）以及当前研究中调查的VR设备类型（3DOF，不允许任何物理运动），这种低发生率并不奇怪。此外，放松体验很少以已知会增加晕机风险的内容为特征，例如移动第一人称视图或包括环境中刺激的快速大移动（Chang等人，2020年），因为这将不利于放松。当前研究中的材料和主题建模表明（通过缺席），VR晕机在现代消费者目标放松应用中并不是一个突出的问题，至少对于3DOF设备来说是这样。然而，这在多大程度上受到特定内容类型的调节仍有待研究：由于晕电术语的总体发生率较低，应用程序之间的内容以及可能的用户使用模式（在某些情况下）之间存在很大差异。以定制选项为特征的应用程序），我们不能估计某些类型的放松体验（例如，缓慢地移动通过虚拟景观vs静坐）是否具有更高程度的晕机报告。这些特定的假设在随机实验中通过详细的使用行为记录和/或通过对比与其他内容相似的特定应用的评论来进行更好的测试。虽然价格主题主要表现为中性甚至积极的主题内情绪，但当包含在多元回归模型中时，它与星级评分呈负相关，并且增加了负面整体评论情绪的几率，该模型还对其他主题的发生进行了调整。这些回归模型没有考虑应用，除了总体发生率较低外，发生率为12.54%，不同应用之间的发生率差异显著，根据应用，出现在0-25%的评论中。此外，免费应用程序与非免费应用程序的星级评定没有差异，尽管这一结果可能受到自发布以来定价模式变化的影响，但没有记录。一起，这些调查结果显示，用户认为一些应用程序定价过高，而另一些则物有所值，这强调了应用程序质量和成本之间的平衡的必要性，开发人员应仔细考虑这一点，并可能定期调整，以满足消费者日益增长的期望。事实上，用户发现一些免费的应用程序很有吸引力，并且愿意为更高质量的应用程序付费，这对于此类应用程序的传播以及通过提供低门槛，有效的方式来处理压力和其他常见的公共健康问题的潜在公共健康影响是有希望的，因为VR作为一种消费技术继续增长（Lindner，2020）。4.1. 优势和局限性当前研究的优势包括对流行的低成本VR设备的30个应用程序进行大样本审查，确保低采样偏差，并使我们能够将结果推广到单个应用程序的评估之外。半自动NLP分析补充了传统的定性方法，并实现了协同定量分析。但仍有一些限制。首先，虽然NLP模型使整个处理管道具有可重现性（原则上适用于其他文本语料库），但它仍然是手动引导的。其次，由于上述原因，目前的研究仅限于对Oculus Go和Gear VR设备可用应用程序的审查，这些应用程序在特定时间点被归类并明确描述为官方数字市场上的放松应用程序。在数据收集时间之前或之后，其他应用可能已经从特定商店类别和/或商店本身添加或移除。在何种程度上，目前的研究结果扩展到其他VR应用程序与放松组件和应用程序的其他 VR设备，以及随着消费者可能变得更加苛刻，这些发现在多大程度上仍然适用，仍有待调查。第三，尽管撰写和出版评论的门槛Oculus Go应用程序的用户数量较低，但审查用户仍然提供了使用每个应用程序的较大人群的样本，其代表性未知。然而，任何抽样偏差都可以预期比明确招募用户体验研究的样本要小得多。使用与个人帐户相关的应用程序使用客观措施的补充研究将提供一个完全公正的，量化的用户体验视图，尽管是一个狭窄的视图。从理论上讲，通过帐户用户名将在线评论与客观的应用程序使用数据联系起来是可能的，但这需要特殊的日志记录程序，用户同意，以及开发人员提供此类链接数据。第四，在第一次探索性研究中，我们选择了相对较低的应用程序内容分类方案中的细节级别，优先考虑健壮性而不是特异性。考虑到许多应用程序的内容一直在变化，这被认为是更合适的S. Fager naés等互联网干预24（2021）1003709发布的详细记录不可用），并且因为定制特征的存在意味着仅仅特定内容的可用性并不等同于其用户体验。出于这个原因，例如，我们避免尝试将正念练习与身体放松的用户体验（两者都由例如Calm Place应用程序提供）分开，这可能具有不同的心理效果（Jain等人，2007年）。可以说，在随机试验的背景下，通过对功能添加前后或类似情况下的特定应用的审查进行时间序列分析来检查此类对比更为合适。最后，由于人类语言固有的复杂性，以及使用的多样性和人为错误的发生，情感分析不太可能产生完美的结果：文本的准确率水平分析（当前研究中的分析水平）通常在70-90%的范围内（Karlgren等人，2012年）。在目前的研究中，从主题模型的情绪显示出与星级在预期的方向，这表明总体上令人满意的有效性

下载后可阅读完整内容，剩余1页未读，立即下载