上下文窗口
可疑窗口
TCN
图1:NCAD使用相同的TCN网络对两个相差一个可疑窗口的窗口进行该模型经过训练,为
可疑窗口中存在异常的实例提供高分。
1.
一种神经网络
编码器
φ(; θ),它将输入序列映射到RE
中的表示向量
。相同的编码器被
应用于全窗口和上下文窗口两者,从而导致关于v的
表示
z
=
φ
(
w
;
θ
)
和
z
(
c
)
=
φ
(
w
(
c
)
;
θ
)
。 虽然
可以使用
神经网络工作
,但在我们的实现中,我们选择具有
指数扩张因果卷积的CNN(vanden Oord等人,2016),特别是TCN架构(Bai et al.,
2018;Franceschi等人,2019年)与自适应最大池沿时间维度。
2.
一个类似距离的函数,dist(
,
):
R
E
R
E
R
+
,用于计算
表示
z
和
z
(
c
)之间 的 相
似性
。
3.
概率评分函数
l
(
z
)
=
exp(
z
),其创建以上下文窗口的嵌入为中心的球形决策
边界。
编码器的参数θ通过最小化小批量窗口w上的分类损失来学习。这些数据是随机(跨时间序
列和跨时间)从
在应用随后的数据增强技术之后训练数据集{
x
(
i
)
}
滚动预测虽然我们的基于窗口的方法允许模型决定可疑窗口中
是否
存在异常,但在许多应
用中,重要的是在异常发生时迅速做出反应为了支持这些要求,我们将该模型应用于时间
序列的滚动窗口。然后,每个时间点可以是对应于不同滚动窗口的不同可疑窗口的一部
分,因此被给予多个异常分数。使用这些,我们可以在第一个高分时发出警报,以减少警
报时间,或者对每个点的分数进行平均,以更准确地及时确定异常。
3.3
数据增强
除了对比分类器之外,我们还利用了一系列数据增强方法,这些方法注入了合成异常,使
我们能够依赖于监督训练目标,而不需要地面实况标签。虽然可以依赖于超球体来训练而
不需要任何标签,但是具有一些异常示例标签允许极大地提高性能,正如在计算机视觉中
所观察到的那样(Hendrycks等人,2019年)。我们不能有效地依赖于地面实况异常,因为
很少有数据集有任何异常,并且在实践中,获得训练标签的成本非常高;因此,我们建议生
成异常示例。这些数据增强方法明确地
不
试图验证异常的完整数据分布,这将是不可行的;
相反,我们结合了有效的通用方法,可以很好地检测常见类型的分布外示例。
背景离群值暴露(
COE
)
-
受离群值暴露成功用于
分布外
检测的启发
Hendrycks et al.
(
2019
),我们提出了一种简单的任务不可知方法来
创建真实的分布外示例。 给定w
w
=
(
w
(
c
)
,
w
(
s
)
)的数据风
,我们
通过用从另一个时间序列获取的值替换可疑段
w
(
s
)
的
值的块来
将异常引入可疑段
w
(
s
)
。
w
(
s
)
中的替换值很可能会破坏与其相邻上下文的时间
关系,因此创建了一个分布外的示例。在我们的实现中,