评注人工智能增强的时空数据挖掘技术:下一代城市计算的新机遇王飞,1,2,4,*姚迪,1,2,4,*李勇,3,4,*孙涛,1,张昭11中国科学院计算技术研究所,北京1001902中国科学院大学,北京1000493清华大学电子工程系,北京1000844作者贡献相等* 通信:wangfei@ict.ac.cn(F.W.); yaodi@ict.ac.cn(D.Y.); liyong07@tsinghua.edu.cn(Y.L.)投稿时间:2023 - 01 - 29;受理时间:2023 - 02 - 19;网络发表时间:2023 - 02 - 21;https://doi.org/10.1016/j.xinn.2023.1004052023作者这是一个在CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。引文:Wang F.,姚D,李宇,例如,(2023年)。人工智能增强的时空数据挖掘技术:下一代城市计算的新机会创新4(2),100405。在过去的几个世纪里,城市化已经成为一种趋势。 2020年,全球平均城市化率为56.2%,1表明大多数国家都已城市化。尽管取得了巨大的成就,但当代城市为了消除这些影响,城市计算,它之间的桥梁城市科学和计算机科学,建议。它试图利用广泛收集的时空数据做出明智的判断,并改善城市的资源分布。 持续收集和分析城市数据在许多应用中产生了显著的好处(见图1)。 人工智能(AI)技术2的近期发展为城市计算带来了新的潜力和障碍。传统的分析方法,采用物理模型,对城市信息的依赖性强,对复杂的城市计算问题作了严格的假设。在核心技术中,数据驱动AI模型自动从数据中提取,实现了数据驱动方法(图1,方框1)。城市可持续发展的困境在本节中,我们将重点介绍应用人工智能技术的挑战(见图1和图2)。从爆炸性的城市数据中提取有价值的知识仍然具有挑战性。从原始城市数据中,仅可获得交通稀疏和噪声已知的交通工具轨迹和电力负载时间序列中的简单这使得很难做出全面和准确的决定。如何,人们所需要的是什么样的知识,它遵循着人口增长规律和经济发展规律。3这通常需要重新设计复杂的模型,并包括实验推断,图1.城市计算中的人工智能增强时空数据挖掘lThe Innovation4(2):100405,2023年3月13日1评注戏剧性的硬。此外,将知识应用于现实世界的城市应用也是一个边缘问题。对巨大的时空系统进行建模是一项具有挑战性的工作。 城市预测的任务是对各种人为因素进行定量分析,如何充分考虑这些相关因素是一个难题。数据驱动的智能学习在学术界受到越来越多的关注。然而,现实世界中的大规模变量严重限制了数据驱动智能学习的性能和效率,为城市计算带来了挑战尽管当前的人工智能技术直接从数据中学习模型,但它们中的大多数依赖于深度神经网络工作(DNN)的能力表达,DNN现在是一个脆弱的“黑匣子”,缺乏如何将输入转换为模型输出的 用户不清楚DNN是如何工作的,甚至设计师也无法解释为什么模型会做出决定。对于城市计算,可靠性对于决策至关重要因此,直接使用基于DNN的AI技术进行城市计算是有风险的。城市计算的最终目标是在城市治理的宏观层面和个人生活的微观层面辅助人们进行智能决策例如,我们假设它是建设规划、交通控制、物流优化、应急响应、疫情防控等的基础然而,目前城市计算的应用更多地停留在数据展示或状态评估上,造成了城市计算目前的发展与其长远目标不匹配的困境。人工智能增强的时空数据挖掘技术的潜在变革尽管城市计算面临挑战,但人工智能增强的时空数据挖掘技术的最新进展提供了新的机会。 我们重新思考当前的人工智能技术,特别是在知识发现,系统规模的时空预测,因果关系分析和智能决策方面,以促进城市计算的发展(图1,方框3)。重新思考知识发现和应用:知识发现和利用是城市计算的关键步骤。近年来,知识推理得到了迅速发展,使我们能够在现实世界的场景中表示和发现知识。 迁移学习允许与不同任务共享信息,这有助于模型在有限数据的情况下发现知识。 强化学习决策过程可以让我们在保留真实数据的同时去除虚假和噪声数据,保证知识推理的效果和质量。最后,通过收集或推理获得的知识可以为各种应用提供丰富的外部信息 我们希望这些知识将提高现有应用程序的有效性。系统尺度时空预测的再思考:城市是一个具有多个相互关联变量的巨大时空系统在城市计算中,一个单一的结果往往来自多个因素的相互作用。多变量时间序列预测可以对多个相关变量建立预测模型,有效地提高对单个变量的预测效果。4它可以应用于许多实际应用,如天气预报和交通预报。此外,近年来,Transformer及其变体的发展,我们可以进行长期预测,拓宽人们对未来的看法。此外,图神经网络近年来引起了广泛关注,并有效地利用图结构来建模各种变量之间的依赖关系使用图神经网络来建模变量之间的空间关系可以提高城市计算应用的性能最后,基于各种变量的历史数据构建大规模的预训练模型,也是城市计算的未来方向,以进一步提高数据的利用率。重新思考因果关系启发的机器学习技术:因果关系是人类理解物理世界如何运作的关键工具 它可以用于形式化数据生成过程,这是自然可解释的。最近,在DNN模型中引入因果关系已经成为提高AI算法可靠性的最有前途的研究方向之一最近的因果人工智能技术已被采用,以提高预测,分类和决策的可靠性。 在城市计算中,许多应用也可以定义为因果问题。例如,调度交通灯需要知道交通堵塞的因果关系。 基于因果机制的调度策略优化可以提高系统的稳定性和可靠性。不幸的是,在城市计算研究中,基于城市计算的工作非常罕见。我们相信,将城市运行的因果机制整合到人工智能模型中,将有利于许多城市计算任务。反思智能决策:城市决策的本质是对复杂系统的决策 传统算法存在模型复杂度高、计算量大的问题。因此,一方面,我们需要对大量具有各种分布的高维变量进行建模,如果不进行简化,这些变量是难以处理的。另一方面,决策行动空间极大。传统的方法无法在可接受的时间内给出可行的解决方案而近年来发展起来的数据驱动的决策模型由于具有较强的表示能力,在解决复杂问题时显示出了优势 它自然适合于处理高维变量,并且易于并行。结论城市计算使我们的城市更加智能和高效。它有效地服务于公共服务,社会治理,公共安全和其他应用。目前,城市数据分析仍然严重依赖专家知识,主要集中在特定场景。人工智能技术有许多局限性,导致实践存在重大差距然而,基于人工智能的时空数据挖掘技术,如知识发现、系统级时空预测、数据驱动的因果分析和智能决策等,有望解决城市计算中的困境,实现新的发展。引用1. Buchholz ,K.( 2020 年) 。世 界城市 人口 从1950 年到2020 年发 生了 怎样的 变化 ?https://www.weforum.org/agenda/2020/11/global-continent-urban-population-urbanisation-%/.2. 徐,Y.,刘,X.,曹,X.,等人(2021年)。 人工智能:科学研究的强大范式。创新2,100179。3. 徐,F.,李,Y.,Jin,D.,等人(2021年)。从人类流动行为看城市增长模式的出现。国家计算机。Sci. 1,791-800。4. 邵,Z.,张志,王福,和Xu,Y.(2022年)。基于预训练增强时空图神经网络的多变量时间序列预测。第28届ACMSIGKDD知识发现和数据挖掘会议论文集,pp。 1567-1577年。5. 隆戈湖,加-地格贝尔河,Lecue,F.,等人(2020年)。可解释的人工智能:概念,应用,研究挑战和愿景。机器学习和知识提取:第四届国际跨领域会议论文集。 1-16号。致谢这项工作得到了青年创新促进协会CAS的支持申报利益作者声明无竞争利益。2TheInnovation4(2):100405,March13,2023www.cell.com/the-innovationwww.the-innovation.org