没有合适的资源?快使用搜索试试~ 我知道了~
时间序列中的无监督异常检测神经和进化计算
时间序列中的无监督异常检测朱利安·奥迪贝尔引用此版本:朱利安·奥迪伯特。时间序列中的无监督异常检测神经和进化计算[cs.NE]索邦大学,2021年。英语。NNT:2021SORUS358 电话:03681871HAL ID:电话:03681871https://theses.hal.science/tel-036818712022年5月30日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire时间序列中的无监督异常检测朱利安·奥迪贝尔为满足学位要求而提交的论文哲学博士在博士学校N. 130:巴黎索邦大学计算机科学、电信和电子学委员会负责:罗曼·塔文纳德马可·洛伦齐雷恩大学2蓝色海岸大学审查员审查员玛丽亚·A. Zuluaga欧洲通信顾问泽维尔·阿拉米达-皮内达格勒诺布尔因里亚检查皮埃特罗·米哈尔迪欧洲通信检查莫里齐奥·菲利波内欧洲通信检查弗雷德里克·古亚德橙色实验室客人塞巴斯蒂安·马蒂橙色客人2021年10月21日ii.到...摘要多变量时间序列中的异常检测是许多领域中的一个主要问题。系统日益增长的复杂性和数据量的爆炸性增长使得自动化成为必不可少的。基于深度学习的方法在检测方面显示出良好的结果,但由于其训练时间长且鲁棒性有限,无法满足工业要求。为了满足工业需求,本文提出了一种基于自编码架构和对抗训练的多变量时间序列异常检测的新的无监督方法,称为USAD 该方法满足了工业世界对鲁棒性和训练速度的要求,同时在检测方面实现了最先进的性能。然而,深度神经网络方法在从数据中提取特征的能力方面受到限制,因为它们仅依赖于局部信息。因此,为了提高这些方法的性能,本文提出了一种引入非局部信息的特征工程策略。该策略在不增加训练时间的情况下提高了基于神经网络的方法的性能。考虑到近年来深度学习方法在多变量时间序列异常检测方面的良好性能,研究人员在其基准测试中忽略了所有其他方法,导致所提出方法的复杂性在当前出版物中爆炸。缺乏与文献中更传统方法的比较并不能保证基准中报告的进展不是虚幻的,这种复杂性的增加是合理的。为了解决这个问题,本文对多变量时间序列中的60种异常检测方法进行了比较,分为三类:传统方法、机器学习方法和基于深度神经网络的方法。这项研究表明,没有证据表明深度神经网络是解决这个问题的必要条件。关键词:异常检测、时间序列、多元、深度学习、无监督摘要多元时间序列中的异常检测是许多领域的主要问题。系统复杂性的增加和数据量的爆炸性增长使得自动化成为必要。基于深度学习的方法已经显示出良好的检测结果,但由于其学习时间长且鲁棒性有限,无法满足工业需求为了满足工业需求,本文提出了一种基于自编码器架构和对抗训练的多变量时间序列异常检测的新的无监督方法,该方法满足了工业世界对鲁棒性和学习速度的要求,同时在检测方面实现了最先进的性能。然而,深度神经网络方法在其从数据中提取特征的能力方面受到限制,因为它们仅依赖于局部信息。因此,为了该策略允许在不增加训练时间的情况下提高基于神经网络的方法的性能。鉴于近年来深度学习方法在多变量时间序列异常检测中的良好表现,研究人员在其基准测试中忽略了所有其他方法,导致当前出版物中提出的方法的复杂性呈爆炸式增长。由于缺乏与文献中更传统方法的比较,因此不能说基准报告中报告的进展不是虚幻的,而且这种日益复杂的情况是必要的为了解决这个问题,本文对16种多变量时间序列异常检测方法进行了比较,分为三种:分类:传统方法、机器学习方法和基于深度神经网络的这项研究表明,没有证据表明深度神经网络是解决这一问题的必要条件。关键词:异常检测确认书vivii内容。图表列表表列表1引言十一十五11.1背景和动机。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...11.2捐款。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...41.3论文结构。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...51.4出版物。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...61.5参与挑战。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...62时间序列中的异常检测72.1时间序列。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ......82.1.1单一与多元。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...82.1.2时间序列的分解。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...82.1.2.1趋势。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...82.1.2.2季节性。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...92.1.2.3级别。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...92.1.2.4噪音。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...9viii2.1.3稳定性。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...102.2异常检测。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...102.2.1时间序列中异常的类型。 . . . . . . . . . . . . . ...112.2.2监督与非监督方法。... ... ... ... ... ... ... ... ... ... ... ... ... ...122.2.3分类学。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...142.2.4常规方法。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...142.2.4.1控制图方法。... ... ... ... ... ... ... ... ... ... ... ... ... ... ...152.2.4.2预测方法。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...15ix内容。2.2.4.3分解方法162.2.4.4相似性搜索方法172.2.5基于机器的学习方法182.2.5.1隔离方法192.2.5.2基于邻居的方法202.2.5.3基于域的方法212.2.6基于深度学习的方法213多变量时间序列35上的无监督异常检测3.1导言363.2自动编码器和生成式对抗网络的限制3.3无人监督异常检测(USAD)373.3.1方法373.3.2实施403.3.3实验设置413.3.3.1数据集413.3.3.2可行性研究:Orange.........................................................3.3.3.3评估指标433.3.4实验和结果443.3.4.1总体性能443.3.4.2参数的影响3.3.4.3培训时间503.3.4.4消融研究513.3.4.5可行性研究513.4结论534从单变量到多变量时间序列非局部信息异常4.1导言564.2相关作品564.3从单变量到多变量时间序列574.4实验和结果604.4.1数据集604.4.2实验设置60x4.4.2.1实施。..................................................................................61内容4.4.3结果614.5讨论和结论645多变量时间序列中的异常检测需要深度神经网络方法吗?675.1导言685.2相关工作685.3实验设置695.3.1公共数据集695.3.2评估指标705.4实验和结果705.4.1性能基准5.4.2WADI72的分析5.4.3培训的影响设置尺寸745.4.4讨论745.5结论766结论和观点816.1结论816.2前景83参考文献85A.1 USAD再现性材料A.2 用于基准重现性的材料xi内容。xii图列表2.1在2000点之前呈上升趋势,在2000点之前呈下降趋势,在4000点之后呈上升趋势。........................................................................................................ 92.2显示2013年和2017年每天平均温度(°C)的时间序列。............................92.3带噪声的时间序列。中:无噪声时间序列。底部:噪音。.......................102.4点异常示例(红色)122.5异常示例(红色)132.6集体异常示例(红色)132.7将时间序列拆分为时间序列Windows192.8隔离正常点(左)和异常点(右)的路径长度2.9DBSCAN21概述2.10 OC-LVM22概述2.11 自动编码器体系结构222.12 生成式对抗网络体系结构2.13 LSTM-VAE架构242.14 甜甜圈架构242.15 百吉饼建筑252.16 DeepAnt架构252.17 DAGMM架构。来源[1]262.18 MAD-GAN架构262.19 RCGAN架构272.20 MSCRED体系结构272.21 MTS-DCGAN架构28xiii图列表2.22 BeatGan建筑292.23 FuseAD架构292.24 RADM体系结构302.25 MTAD-TF架构312.26 ALAD架构322.27 OmniAnomaly架构333.1说明培训中信息流的建议体系结构。........................................................... 403.2描述检测阶段信息流的建议体系结构。.......................................................413.3参数的影响。准确度、回忆和F1-分数是A)训练集的C)潜在空间的大小Z和D)训练..................................................................3.4有或没有对手训练对USAD52的影响3.5USAD检测到配置事件的可行性研究的时间序列示例显示了33个时间变量中的24个。橙色框突出显示变量参考。 橙色,系列参考第3.3.4.5节。........................................................... 534.1DNN的自动特征学习和提取仅限于本地邻居,其通常由输入窗口信息表示。中间:矩阵配置文件算法链接到非局部特征,这是通过比较时间序列的每个窗口获得的所提出的策略通过组合原始时间序列将原始单变量时间序列转换为多变量时间序列,将非局部特征信息引入DNN。以及使用矩阵配置文件获得的非本地信息。...............................................584.2USAD仅使用组合矩阵-轮廓和原始单变量时间序列的多变量输入正确检测到异常4.3USAD仅使用组合矩阵-轮廓和原始单变量时间序列的多变量输入正确检测到异常xiv图列表5.1顶行:传统方法的假阴性;第二行:机器学习算法的假阴性;第三行:DNN方法的假阴性;第四行:DNN方法预测良好的传统方法的假阴性;第五行:第73章:第一次见面5.2由于电动阀(1_MV_001)激活导致油箱(1_LT_001)提前填充,导致红色背景异常它到达切换阈值(位于40)5.3SWaT数据集上受试者操作特征曲线(AUC)下的面积。.......................755.4SWaT数据集上的平均精度(AP)。.......................................................... 765.5WADI数据集上受试者操作特征曲线(AUC)下的面积。......................775.6WADI数据集上的平均精度(AP)。......................................................... 78xv图列表xvi表列表2018-2021年多变量时间序列异常检测的同行评审深度学习3.1基准数据集。(%)是数据集中异常数据点的百分比............................... 423.2准确度(P)、回忆度(R)和F1评分在SWaT数据集中没有点调整。....................................................................443.3性能比较。准确度(P)、回忆(R)和F1评分在WADI数据集中没有点调整。...................................................................453.4SMAP、MSL和SMD数据集的性能比较点调整。 报告了P、R F1和F1*。................................................................ 463.5使用所有数据集的平均性能(±标准差)点调整。...........................................................................................................473.6SWaT数据集50的不同灵敏度阈值的异常检测结果3.7每个数据集上每个纪元的培训时间(分钟)3.8橙色内部数据集的异常检测结果(无点调整)4.1不同方法的超参数设置4.2性能和计算时间方法。...................................................................................625.1基准数据集。(%)是数据集中异常数据点的百分比............................... 705.2按每个方法类别总结的性能指标对于每个测量值,平均值±标准差,以及[最小值,报告了每个类别的最大值。值报告为%79xvii表列表1每个数据集的USAD超参数。 K忽略窗口size和m是潜在空间的维度。...................................................................... 100
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功