神经上下文异常检测：时间序列分析新框架 - CSDN文库

时间序列异常检测

多变量时间序列

138 浏览量更新于2024-06-19 收藏 1.22MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

资源详情

资源推荐

+v：mala2277获取更多论

文

5

·

−||

··

×→

1：

T

i

全窗口

TCN

不

score = dist（z

，

z

（

c

）

）

上下文窗口

可疑窗口

TCN

图1：NCAD使用相同的TCN网络对两个相差一个可疑窗口的窗口进行该模型经过训练，为

可疑窗口中存在异常的实例提供高分。

1.

一种神经网络

编码器

φ（; θ），它将输入序列映射到RE

中的表示向量

。相同的编码器被

应用于全窗口和上下文窗口两者，从而导致关于v的

表示

z

=

φ

（

w

;

θ

）

和

z

（

c

）

=

φ

（

w

（

c

）

;

θ

）

。虽然

可以使用

神经网络工作

，但在我们的实现中，我们选择具有

指数扩张因果卷积的CNN（vanden Oord等人，2016），特别是TCN架构（Bai et al.，

2018;Franceschi等人，2019年）与自适应最大池沿时间维度。

2.

一个类似距离的函数，dist（

，

）：

R

E

R

E

R

+

，用于计算

表示

z

和

z

（

c

）之间的相

似性

。

3.

概率评分函数

l

（

z

）

=

exp（

z

），其创建以上下文窗口的嵌入为中心的球形决策

边界。

编码器的参数θ通过最小化小批量窗口w上的分类损失来学习。这些数据是随机（跨时间序

列和跨时间）从

在应用随后的数据增强技术之后训练数据集{

x

（

i

）

}

滚动预测虽然我们的基于窗口的方法允许模型决定可疑窗口中

是否

存在异常，但在许多应

用中，重要的是在异常发生时迅速做出反应为了支持这些要求，我们将该模型应用于时间

序列的滚动窗口。然后，每个时间点可以是对应于不同滚动窗口的不同可疑窗口的一部

分，因此被给予多个异常分数。使用这些，我们可以在第一个高分时发出警报，以减少警

报时间，或者对每个点的分数进行平均，以更准确地及时确定异常。

3.3

数据增强

除了对比分类器之外，我们还利用了一系列数据增强方法，这些方法注入了合成异常，使

我们能够依赖于监督训练目标，而不需要地面实况标签。虽然可以依赖于超球体来训练而

不需要任何标签，但是具有一些异常示例标签允许极大地提高性能，正如在计算机视觉中

所观察到的那样（Hendrycks等人，2019年）。我们不能有效地依赖于地面实况异常，因为

很少有数据集有任何异常，并且在实践中，获得训练标签的成本非常高;因此，我们建议生

成异常示例。这些数据增强方法明确地

不

试图验证异常的完整数据分布，这将是不可行的;

相反，我们结合了有效的通用方法，可以很好地检测常见类型的分布外示例。

背景离群值暴露（

COE

）

-

受离群值暴露成功用于

分布外

检测的启发

Hendrycks et al.

（

2019

），我们提出了一种简单的任务不可知方法来

创建真实的分布外示例。给定w

w

=

（

w

（

c

）

，

w

（

s

）

）的数据风

，我们

通过用从另一个时间序列获取的值替换可疑段

w

（

s

）

的

值的块来

将异常引入可疑段

w

（

s

）

。

w

（

s

）

中的替换值很可能会破坏与其相邻上下文的时间

关系，因此创建了一个分布外的示例。在我们的实现中，

剩余23页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈