没有合适的资源?快使用搜索试试~ 我知道了~
0博士学位论文0雷恩1大学0É COLE D OCTORALE N O 601数学与信息与通信科技学院 专业: 计算机科学0作者:LoïckBONNIOT0使用统计学习进行计算机网络建模和根本原因分析0论文提交和答辩日期:2021年6月10日 研究单位:IRISA (UMR6074)0答辩前评审人:0Chadi BARAKAT 研究主任,Inria Sophia Antipolis Isabelle CHRISMENT教授,洛林大学0评审委员会成员:0主席:Élisa FROMONT 教授,雷恩1大学 评审人:Chadi BARAKAT 研究主任,Inria Sophia AntipolisIsabelle CHRISMENT 教授,洛林大学 Leonardo LINGUAGLOSSA 讲师,巴黎电信学院 导师:FrançoisTAÏANI 教授,雷恩1大学 联合导师:Christoph NEUMANN 首席科学家,InterDigital0受邀人:0Sandrine VATON 教授,Brest IMTA30致谢0首先,我要衷心感谢François Taïani和ChristophNeumann,在我博士期间给予我信任和指导。尽管面临困难时期,他们让我学习了许多不同的主题,并使得本文档中呈现的所有实验和发现成为可能。我还要感谢ANRT和Technicolor(后来是InterDigital)为本论文提供资金支持和良好的工作环境。当然,我还要感谢我的博士委员会的所有成员:Chadi Barakat和IsabelleChrisment对我的手稿进行耗时的审查和尖锐的评论;Élisa Fromont、LeonardoLinguaglossa和SandrineVaton对答辩期间提出的有见地的意见和建议表示感谢。非常感谢!作为一名CIFRE学生,我有幸拥有两个非常有启发性的同事团队。首先感谢Technicolor和InterDigital的Home实验室(Corentin、François、Jean-Renan、Laurent、Mario、Michel、Nicolas、Pascal、Patrick、Thierry等):在疫情期间,我错过了我们的午餐和咖啡讨论。希望很快能见到你们!我还要感谢InriaWIDE团队的所有过去和现任成员,当然还包括我的博士同伴:Pierre-Louis、Olivier、Adrien、Louison、Quentin、Alex。我也怀念我们激烈的午餐对话!作为特别感谢,我非常感激Virginie和Nelly在需要时帮助我在行政迷宫中航行。请允许我用一点点法语离题一下:博士论文的工作并不总是容易的,但我始终可以依靠父母的信任和朋友的好心情前进。Ben,感谢你的校对和敏锐的眼睛,当然还要感谢Camille一直在我身边。非常感谢大家!0最后,我感谢您阅读本论文。我真诚地希望它能为您提供关于网络建模和根本原因分析的有趣见解。50目录01 引言 901.1 计算机网络的日益复杂性 . . . . . . . . . . . . . . . . 901.2 基于数据的网络建模方法 . . . . . . . . . . . . . . . . . . 1101.3 研究挑战和发现 . . . . . . . . . . . . . . . . . . . . . . . . . . 1201.3.1 用于快速性能预测的网络建模 . . . . . . . . . . . 1301.3.2 从边缘进行根本原因分析 . . . . . . . . . . . . . . . . . . . . 1401.3.3 利用Web浏览器进行网络指标收集 . . . . . . . . 1501.4 论文概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1602 背景 1702.1 定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1902.2 网络建模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2202.2.1 从完整网络知识进行建模 . . . . . . . . . . . . . . 2202.2.2 从有限知识进行建模 . . . . . . . . . . . . . . . . . . . . 2402.3 根本原因分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2702.3.1 从完整网络知识进行RCA . . . . . . . . . . . . . . . . . 2802.3.2 从有限知识进行RCA . . . . . . . . . . . . . . . . . . . . . . . 3002.4 机器学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3302.4.1 方法论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3302.4.2 朴素贝叶斯分类器 . . . . . . . . . . . . . . . . . . . . . . . . . . . 3502.4.3 决策树学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . 3602.4.4 集成学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3702.4.5 人工神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . 3702.5 结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4303 使用图神经网络进行计算机网络建模 4503.1 背景和动机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4703.1.1 ITU 2020年图神经网络挑战 . . . . . . . . . . . . . . 4703.1.2 RouteNet基线 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4860目录03.2 我们的提议:为网络节点学习表示 . . . . . . . . . . . . . . . . . . . . . . 5003.2.1 依赖建模的二部图上的消息传递 . . . . . . . . . . . . . . . . 5003.2.2 方法A1:使用节点嵌入进行专用表示 . . . . 5303.2.3 方法A2:通过链接嵌入进行节点表示 . . . . . 5703.3 使用GNN挑战数据集进行评估 . . . . . . . . . . . . . . . . . . . . . . . . . 5803.3.1 数据集介绍和挑战结果 . . . . . . . . . . . . . . . . . . . . . . . 5803.3.2 方法论和实现细节 . . . . . . . . . . . . . . . . . . . . . . . . 6103.3.3 最佳训练策略的技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . 6303.3.4 消融分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6503.3.5 学习表示的可视化 . . . . . . . . . . . . . . . . . . . . . . . . . . 6903.4 结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7204 互联网规模的卷积根本原因分析 7304.1 RCA的挑战来自终端用户 . . . . . . . . . . . . . . . . . . . . . . . . . . 7504.1.1 网络和服务的不可知性 . . . . . . . . . . . . . . . . . . . . . 7504.1.2 异常分离 . . . . . . . . . . . . . . . . . . . . . . . . . . 7504.1.3 位置的不可知性 . . . . . . . . . . . . . . . . . . . . . . . . . . . 7604.1.4 根本原因可扩展性 . . . . . . . . . . . . . . . . . . . . . . . . . . 7604.2 使用DiagNet进行卷积RCA . . . . . . . . . . . . . . . . . . . . . . . . . 7804.2.1 方法论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7804.2.2 DiagNet推断模型 . . . . . . . . . . . . . . . . . . . . . . 8004.2.3 非重叠卷积与池化 . . . . . . . . . . . . . . . . 8104.2.4 适用于特定服务 . . . . . . . . . . . . . . . . . . . . . . . . . . . 8304.2.5 通过注意机制进行细粒度推理 . . . . . . . . . . . . . . . . . . . . 830受控故障的评估 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8704.3.1 实验设置 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8704.3.2 基准比较 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9004.3.3 受控故障下的DiagNet评估结果 . . . . . . . . . . . . 9104.4 结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 990从理论到实践:通过网络浏览器进行根本原因分析 10105.1 从浏览器中收集数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10305.1.1 动机和相关工作 . . . . . . . . . . . . . . . . . . . . . . . . 10305.1.2 DiagSys的架构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10605.1.3 由地标提供的QoS测量 . . . . . . . . . . . . . . . . . . . . . . 10770目录05.1.4 浏览器提供的第三方QoE监测 . . . . . . . . . . . . . . . 11005.2 从我们收集的数据集中获得的见解 . . . . . . . . . . . . . . . . . . . . . . . . . 113 5.2.1数据集案例研究 . . . . . . . . . . . . . . . . . . . . . . . . . . . 11405.2.2 数据集故障分析 . . . . . . . . . . . . . . . . . . . . . . . . . . 11905.2.3 我们的提议:从历史数据中进行标注 . . . . . . . . . . . . . . . 12005.3 将DiagNet应用于DiagSys的数据集 . . . . . . . . . . . . . . . . . . . . . 12405.3.1 根本原因分析(RCA)方法的变化 . . . . . . . . . . . . . . . . . . . 12405.3.2 定位故障家族 . . . . . . . . . . . . . . . . . . . . . . . . . . 12505.3.3 在互联网规模上进行完整的根本原因分析 . . . . . . . . . . . . . . 12605.3.4 讨论和未解决的问题 . . . . . . . . . . . . . . . . . . . . . . . . . 12805.4 结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13006 结论 13106.1 总结和未来工作 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 6.1.1数据驱动网络建模需要现实的排队 . . . 13106.1.2 准确的RCA模型的基本问题 . . . . . . . . . . . . . . . . . . . . . . . 13206.2 展望:各方之间更大的合作 . . . . . . . . . . . . . . . . . . . . . . . . . . 134 6.2.1服务提供商需要更好的透明度 . . . . . . . . . . . . . . . . . . 13406.2.2 迈向标准测量API的方法 . . . . . . . . . . . . . . 13506.2.3 众包作为潜在解决方案 . . . . . . . . . . . . . . . . . . 1370法语摘要 1390出版物 1490缩略语 1510参考文献 15390第一章0引言0“我们现在都通过互联网连接在一起0互联网就像一个巨大的大脑中的神经元。”0斯蒂芬∙霍金0互联网已成为许多组织、个人和机器的主要通信方式。它由数千个网络运营商联合提供支持,以实现地球上任何设备之间的快速和可靠的通信。互联网在许多方面取得了巨大的成功,但它仍面临巨大的挑战。特别是随着全球互联网需求和多媒体服务的崛起,运营商越来越难以确保良好的用户体验。相比之下,网络的复杂性对终端用户来说大多是隐藏的:在实践中,故障排除连接故障仍然很困难。机器学习领域的最新进展表明,数据驱动的方法可以帮助理解互联网等复杂系统。在本论文中,我们展示了即使可用知识有限,这些方法也可以用于大型计算机网络建模。01.1 计算机网络的日益复杂性0过去几年中,对更快互联网的需求在全球范围内急剧增加。根据国际电信联盟(ITU)的“事实和数据”[1],2020年全球超过50%的人口已经接入互联网,而十年前这个比例不到30%。特别是,69%的15-24岁人口可以访问互联网。拥有宽带接入的家庭数量也从2010年的30%增加到2019年的57%。随着连接的人口增加,每个人所需的带宽也显著增加。这种发展是自然的,因为媒体技术的进步使得捕捉、处理和显示高清内容(如图像、音乐、视频、游戏等)变得更加廉价。例如,根据思科的估计[2],2018年至2020年间4K电视的数量翻了一番。随着时间推移,越来越多的设备也连接到互联网上:预测显示,到2023年可能有超过130亿台设备连接,其中包括像自动驾驶车辆或基于云的监控摄像头这样对带宽需求较大的设备。由于地区封锁和更广泛的远程办公需求,新冠疫情进一步增加了宽带流量的需求。(例如,意大利在2020年封锁期间的流量比2019年同期增加了44%[1]。)All this added complexity may however backfre and lead to severe outages. On July 17,2020, while attempting to solve a relatively benign network congestion problem, a Cloudfareengineering team updated a router confguration. However, this confguration change con-tained an error that redirected the entire Cloudfare trafc through a single network location:this led to the global outage of most of the 12 million websites served by the company forabout 30 minutes [5]. Automated systems also may fail spectacularly: on August 30, 2020,CenturyLink/Level3 (one of the biggest network operator according to CAIDA [6]) triggered a100第1章 - 引言0所有这些增加的复杂性可能会导致严重的故障。2020年7月17日,Cloudfare的工程团队在试图解决一个相对温和的网络拥塞问题时,更新了路由器配置。然而,这个配置更改包含了一个错误,将整个Cloudfare的流量重定向到一个网络位置:这导致了该公司为大约30分钟全球范围内服务的大部分1200万个网站的中断[5]。自动化系统也可能出现严重故障:2020年8月30日,根据CAIDA的数据,CenturyLink/Level3(据称是最大的网络运营商之一)触发了一个0为了应对不断增长的需求,互联网运营商已经投资扩展他们的网络:根据国际电信联盟的数据,从2019年到2020年年中,全球新增了200 Tbit/sec的网络容量,估计总容量达到700Tbit/sec。自2018年以来,全球终端用户连接的宽带(移动)带宽平均每年增长20%(27%),预计到2023年将达到110 Mbit/sec(44Mbit/sec)[2]。尽管这意味着正在部署更多的洲际电缆、本地光纤和天线,但运营商管理网络的策略也需要发展。一个重要的变化是转向软件定义网络(SDN),其中网络控制平面与转发(数据)平面分离:这种模式可以更好地适应客户的动态需求。在[2]中,40%的调查运营商已经切换到这种网络,还有55%的运营商预计在两年内部署。SDN理论上可以自动化大部分流量工程任务,实现优化的网络配置、路由和运营商之间的对等策略。在5G网络中(通过设计启用SDN),运营商被激励在“边缘”部署网络功能,以实现云游戏或大规模遥测分析等新的用例。实际上,这意味着在数据中心甚至靠近终端用户的天线上部署大量的计算资源。互联网服务和应用也必须调整其基础设施以满足需求,例如在多个全球位置部署分布式系统。尽管有各种各样的云服务提供商,但这些分布式系统自然增加了复杂性和新的依赖关系。例如,Netfix已经在500多个位置部署了交付服务器,以满足全球视频流媒体的需求[3],使其成为2020年法国最大的内容提供商[4],超过了谷歌和其YouTube视频服务。1101.2 基于数据驱动的网络建模方法0为了保护客户免受网络攻击,进行了一项小的更改。一系列自动化事件导致CenturyLink/Level3向其他网络运营商宣布了大量的路由更改,导致互联网在近五个小时内大部分瘫痪[7]。在这些例子中,初始根本原因和观察到的症状之间的关系对于内部人员来说甚至都不明显,这是由于网络组件之间的许多依赖关系。对于研究人员或最终用户等外部观察者来说,故障排除和理解互联网故障更加复杂,因为大多数这些依赖关系是隐藏的(出于技术或商业原因)。虽然通过互联网交换点(IXP)可以获得一些公开信息,但大多数互联网拓扑和互联网利益相关者之间的关系仍然难以推断[8]。01.2 基于数据驱动的网络建模方法0自动化、优化和决策软件程序被网络运营商广泛使用,以提供良好的服务质量并降低运营成本。这些程序在历史上基于专家设计的静态决策规则上运行,可能难以理解现代计算机网络的复杂依赖关系。然而,对于网络设计和运营,统计学和数据驱动方法越来越受到关注:机器学习算法利用运营商收集的大量数据来生成他们网络的相关模型。然而,由于管理网络的规模庞大,将机器学习技术应用于计算机网络和互联网在实践中仍然困难。这些网络确实难以进行仪器化,以获取连续的测量和最新的信息。此外,随着最近向雾计算和边缘计算的转变,更多的管理决策由具有对整个网络有限知识的设备自动执行。0在过去的十年中,计算效率的提高使得神经网络和深度学习模型取得了突破性的解决方案。一个非常流行的例子是谷歌的AlphaGo,这是第一个能够击败职业围棋选手的软件[9](2016年)。其他例子包括从图像分析的历史主题到多媒体内容合成、数据驱动的翻译模型或网络物理系统分析等各个领域。由于它们的表达能力,这些解决方案已经证明在建模复杂系统和依赖关系方面比大多数传统方法更好。特别是在有足够的数据的情况下,深度学习模型能够提取(“学习”)输入数据中的复杂隐藏关系,从而得到更准确和可推广的解决方案。120第1章 - 引言0在这篇论文中,我们认为统计学习可以帮助建模具有复杂相互依赖关系的大型计算机网络,即使对于评估的网络的信息有限。我们通过将最近在图像和图形处理技术方面取得的进展应用于计算机网络,并使用从模拟和真实网络收集的数据来证明这一观点。0我们的研究结果倡导在计算机网络的设计和管理中融入更多的数据驱动技术。尽管这些网络变得越来越复杂和难以管理,但这些技术有潜力提高网络性能,同时降低停机风险和运营成本,这是网络运营商的基本指标。另一方面,我们的贡献也表明,即使对于对计算机网络几乎没有先验信息的外部观察者,他们也可以使用统计学习来研究计算机网络的特性。这对于包括希望评估网络运营商或第三方研究活动的消费者在内的许多参与者来说非常重要。虽然我们在这篇论文中专注于计算机网络,但我们相信大部分贡献可以应用于其他具有有限变化的相互依赖系统领域。例如,我们相信我们的技术可能适用于任何网络物理系统(例如智能电网或工业控制系统)、社交和交通网络或化学和生物过程。01.3研究挑战和发现0在本论文的剩余部分,我们研究与我们在上一节中提出的主张相关的不同问题。具体而言,我们主要根据可用于统计学习的可用信息量来区分问题。实际上,当一个人可以访问完整的网络拓扑和内部组件的特性时,解决所考虑的问题与只能进行有限测量并将网络视为“黑盒”的情况下非常不同。这种区分或多或少地对应于网络运营商(对其网络有相对较好的概览)和外部观察者之间的知识差异。因此,我们考虑的挑战根据可用知识的数量而不同:0—在第1.3.1节的第一个挑战中,我们考虑网络运营商希望估计网络性能指标的情况,了解网络拓扑和网络组件的特性;这些拓扑和特性可能是当前部署的,也可能涉及计划中的配置更改;1301.3.研究挑战和发现0—在第1.3.2节和第1.3.3节中,我们询问是否可以通过统计学习和有限的网络信息来确定观察到的故障的根本原因。解决这个挑战将允许所有互联网相关方理解和排除故障,而这在目前缺乏可用信息的情况下非常困难。0统计模型通常是基于特定环境(即计算机网络)构建的,适用于同一环境。然而,解决上述挑战的实际解决方案应该是可推广到任何规模的计算机网络的。通过设计可扩展和可推广的模型,我们确保我们的贡献符合这一要求。01.3.1快速性能预测的网络建模0由于计算机网络组件之间的复杂相互依赖关系,通常很难预测给定网络配置在实践中的表现如何。这对于希望优化其配置而不引入问题的网络运营商来说是一个重大问题:网络的一部分的微小变化可能导致其他看似无关的部分的性能变化。在历史上,运营商使用专业知识和模拟,但这些方法可能不准确且速度慢。在大规模动态网络的背景下,今天需要新的强大而高效的解决方案。0知识定义网络(KDN)范式[10]已在此方面提出。它提议利用SDN(便捷的度量收集和网络管理)和机器学习的综合能力来高效地设计和控制大型复杂的计算机网络。在KDN中,需要从已知的网络配置中对网络进行建模,以便应用自动化决策。建模的一个目标是在配置更改时预测网络性能,以做出最佳决策。受基于图神经网络(GNNs)[11]的先前工作的启发,我们在本论文中提出了在多个二部图中明确建模网络组件之间的依赖关系。我们在这个依赖模型上应用最新的GNN技术,并在几百毫秒内获得了对大型网络的非常准确的预测(相比之下,模拟工具需要几分钟才能进行相同的预测)。特别是,我们的贡献可以处理具有各种调度策略的网络组件。我们展示了它可以推广到不同的网络拓扑和配置,并通过可视化学习表示来探索其内部工作原理。140第1章 - 引言0这项工作是在ITU和巴塞罗那网络中心共同组织的机器学习挑战的背景下进行的[12]。我们很荣幸赢得了这个挑战,并在以下报告中发表了我们的方法(撰写时,正在为SIGCOMMCCR和NeurIPS准备其他提交,见第149页):0Loïck Bonniot,Christoph Neumann,François Schnitzler和François Taïani。“GraphNeural Networking Challenge 2020 - Steredeg'ssolution”。2020。网址:https://github.com/ITU-AI-ML-in-5G-Challenge/ITU-ML5G-PS-014-Steredeg/blob/main/report.pdf01.3.2 边缘根本原因分析0当用户通过互联网访问服务时,宽带和移动互联网用户经常遇到性能下降和连接问题。在这些事件中,对于终端用户来说很难确定观察到的症状背后的根本原因:是由于无线覆盖差?服务停机?设备配置错误?互联网服务提供商(ISP)通常被用户指责为许多被感知为降级的原因,因为他们负责提供良好的互联网连接。因此,他们的客户支持团队经常因实际上不是由ISP引起的症状而被召唤。这导致额外的支持成本和损害客户关系:2018年,电视和电信客户服务在美国排名最差[14]。0终端用户和互联网服务提供商都将受益于自动化的根本原因分析(RCA)解决方案,能够准确定位故障的最可能起源。客户可以快速定位故障,同时避免大部分耗时的电话,从而提高满意度(75%的美国年轻一代公民更喜欢在客户服务关系中进行书面沟通[15]);相反,互联网服务提供商只会收到可能在其责任范围内的根本原因的报告。受影响的第三方互联网服务也将从更好的客户体验和自动报告中受益,因为即使是小的性能下降也可能导致收入下降[16, 17]。0在这种情况下,与前一个问题(第1.3.1节)相比,可用的知识大大减少:当从一个用户的角度进行RCA时,无法访问互联网服务的完整拓扑和依赖关系。为了解决这个问题,我们提出利用众包测量和在许多互联网位置部署的参考(“地标”)测量服务器的组合:通过从这些视角收集度量,我们展示了即使没有ISP的合作,也可以确定许多根本原因。我们利用一个包含受控故障的收集数据集来构建根本原因模型,并展示了卷积神经网络(CNN)在性能上优于两种从典型机器学习算法派生的替代解决方案。特别是,我们的CNN模型在设计上是可扩展的,并支持动态地标服务器。这项工作已在以下论文中介绍:1.3.3Leveraging web browsers for network metrics collection1501.3. 研究挑战和发现01.3.3 利用Web浏览器收集网络度量0Loïck Bonniot,Christoph Neumann和François Taïani。“Towards Internet-ScaleConvolutional Root-Cause Analysis withDiagNet”。在:第35届IEEE国际并行与分布式处理研讨会。2021。doi:10.1109 /IPDPS49936.2021.00084。网址:https://hal.archives-ouvertes.fr/hal-025348880本论文中我们提出的第三个贡献与RCA相关的度量收集有关。在这项最后的工作中,我们强调了在实际的RCA框架中需要体验质量(QoE)度量,并推动了在此方面对终端用户设备的执行环境进行仪器化。更具体地说,我们认为Web浏览器是收集度量的良好平台,可以提供QoE和网络度量(服务质量(QoS)度量)的准确估计。我们提出了一套基于浏览器功能的方法,考虑到现代Web浏览器的安全限制。0在一年多的时间里,我们使用我们提出的框架和志愿者终端用户部署和收集了指标。我们从收集的数据集中得出了一些有趣的发现,包括随时间变化的QoE变化,流量差异化定位或重要的互联网路由变化。我们还提出了一种统计方法来定位故障和相关的根本原因,我们在数据集中观察到了这些故障和QoE降级。因此,由于我们的数据集与我们之前使用的具有可控故障的数据集显著不同,我们得到了不同的结果,显示出典型的机器学习基线对于RCA问题仍然有趣。尽管整体性能较低,但我们的研究仍然证明了统计学习在RCA中的兴趣,并提出了一些有趣的问题和未来工作的研究方向。我们的方法论和数据集的初步发现在下面的论文中进行了描述:0Loïck Bonniot, Christoph Neumann, and François Taïani. « DiagSys:从浏览器的角度进行网络和第三方Web服务监控(工业轨道) ». In:Proceedings of the 21st International Middleware Conference Industrial160第1章 - 介绍0Track . 计算机协会, 2020, pp. 16–22. isbn: 978-1-4503- 8201-4. doi:10.1145/3429357.3430520 . url: https://hal.archives- ouvertes.fr/hal-0296729001.4 论文概述0本论文按照我们在前一节中描述的概要进行,每一章都是独立的。0—我们在第2章中介绍了关于计算机网络的一些重要定义,以及有关网络建模和RCA的其他背景。在第2.4节中,我们还介绍了一些基本的机器学习概念,包括最近的神经网络发展,如卷积神经网络(CNNs)和图神经网络(GNNs)。0—在第3章中,我们详细介绍了可推广的GNN在网络路径性能预测中的应用。本章包括我们在ITU和巴塞罗那神经网络中心共同组织的GNN挑战赛中的结果细节。0—第4章介绍了我们的第二个贡献DiagNet,这是一个可扩展的神经网络模型,用于从终端用户设备进行RCA。特别是,我们展示了DiagNet与从常见的统计学习方法派生的另外两个模型(即可扩展的朴素贝叶斯和可扩展的随机森林分类器)的性能对比。在本章的实验中,我们利用了一个在几周内收集的注入了可控故障的数据集。0—为了评估DiagNet在真实的互联网故障中的表现,我们在一年多的时间内设计和部署了一个完整的测量平台。我们在第5章介绍了这个平台DiagSys。这个最后的贡献表明,构建具有真实故障的系统比构建具有可控故障的系统更具挑战性。然而,我们成功地从这个数据集中构建了数据驱动的RCA模型,并在本章中展示了我们的结果。0— 最后,在第6章中,我们总结了本论文,并对未来几年的网络建模和RCA服务提出了展望和有希望的想法。170第二章 背景0目录02.1 定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1902.2 网络建模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2202.2.1 从完整的网络知识建模 . . . . . . . . . . . . . . 2202.2.2 有限知识下的建模 . . . . . . . . . . . . . . . . . . . . . . . . . . 2402.3 根本原因分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2702.3.1 完整网络知识下的根本原因分析 . . . . . . . . . . . . . . . . 2802.3.2 有限知识下的根本原因分析 . . . . . . . . . . . . . . . . . . . . . 3002.4 机器学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3302.4.1 方法论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3302.4.2 朴素贝叶斯分类器 . . . . . . . . . . . . . . . . . . . . . . . . . 3502.4.3 决策树学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . 3602.4.4 集成学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3702.4.5 人工神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . 3702.5 结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430在本章中,我们提供了理解后续章节所需的必要背景知识,以及相关的相关工作。我们首先在第2.1节中定义了本论文中使用的重要概念,特别是我们如何定义计算机网络。然后,我们在第2.2节中介绍了网络建模问题。根据我们在引言中的直觉(根据对网络知识的完整与有限分别采用不同的方法),我们提出了这个问题的两个不同变体。第一个变体对应于网络的设计时间,当人们可以访问大多数组件的低级特性时:在这种情况下,目标通常是预测网络的行为,并回答诸如“组件之间的预期延迟是多少?”、“是否有任何饱和的组件?”或“我们可以做些什么来改进网络?”等问题。第二个变体更适合于操作时间,并采用相反的策略。从全局或宏观测量中,且没有任何先前对网络内部工作的细粒度知识,我们能否推断出网络组件的低级属性?这些属性通常在180第2章 - 背景0由于成本过高或因为一方无法出于商业原因访问它们,有些操作是无法获得的。然而,它们对于许多用例来说
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功