时间序列异常检测数据集
时间: 2024-12-31 12:37:02 浏览: 8
### 时间序列异常检测数据集
对于时间序列异常检测的任务,多个公开可用的数据集提供了丰富的资源来训练和评估模型。这些数据集涵盖了多种应用场景和技术挑战。
#### NAB (Numenta Anomaly Benchmark)
NAB 是一个广泛使用的基准测试平台,旨在促进机器学习算法在真实世界中的应用和发展。该数据集包含了来自不同领域的实际时间序列数据,并标注了已知的异常事件[^3]。
```python
import pandas as pd
nab_data = pd.read_csv('path_to_nab_dataset.csv')
print(nab_data.head())
```
#### Yahoo Webscope S5
Yahoo 提供了一个名为 Webscope 的系列数据集集合,其中S5部分专门针对大规模在线广告系统的性能监控设计而成。它由五个子文件夹组成,每个都含有特定类型的异常模式以及相应的标签信息。
#### KPI(Knowledge Platform Interface) Dataset from Baidu
百度智慧运维团队发布的KPI数据集来源于内部生产环境的真实流量日志记录。此数据集不仅规模庞大而且质量较高,非常适合用来检验复杂场景下的异常发现能力。
#### SWAT(Singapore Water Threats Testbed)
SWAT 数据集模拟了一座水处理厂内的物理过程,在正常操作条件下采集传感器读数的同时也故意引入了一些攻击行为作为异常样本。这对于研究工业控制系统安全防护具有重要意义。
相关问题
飞机时间序列异常检测数据集
以下是一些可用于飞机时间序列异常检测的数据集:
1. NASA Turbofan Engine Dataset: 这个数据集由NASA提供,包含了数百个单发涡轮风扇发动机的时间序列数据,每个时间序列都包含数千个数据点。数据集中包含了不同类型的故障,例如轴承故障和压缩机故障。
2. FEMTO Dataset: 这个数据集由法国小型机械制造商FEMTO-ST提供,包含了来自轴承的振动数据。数据集中包含了来自四个不同状态的轴承的时间序列数据:正常状态、内圈故障、外圈故障和滚珠故障。
3. SMD Dataset: 这个数据集包含了来自机械制造业的时间序列数据,包括轴承、齿轮、泵和阀门等部件的数据。数据集中包含了来自不同状态的时间序列,包括正常状态、故障状态和过渡状态。
4. PHM08 Dataset: 这个数据集由美国机械工程师学会提供,包含了来自不同状态的轴承的时间序列数据。数据集中包含了正常状态、内圈故障、外圈故障和球故障等状态的数据。
这些数据集都可以在网络上免费获取,并且可以用于飞机时间序列异常检测的研究和实践。
多变量时间序列异常检测数据集
以下是一些多变量时间序列异常检测数据集的例子:
1. Numenta Anomaly Benchmark (NAB):这个数据集由Numenta公司开发,包含了许多有趣的多变量时间序列数据,如机器温度、网络流量等。NAB数据集中也包含了一些异常数据,可以用于异常检测。
2. Yahoo! Labs Webscope数据集:这个数据集由Yahoo! Labs开发,包含了许多有趣的多变量时间序列数据,如股票价格、天气数据等。这个数据集也包含了一些异常数据,可以用于异常检测。
3. SMD数据集:这个数据集由斯坦福大学开发,包含了来自数据中心的多变量时间序列数据,如CPU使用率、磁盘空间利用等。这个数据集也包含了一些异常数据,可以用于异常检测。
4. ECG数据集:这个数据集包含了来自心电图信号的多变量时间序列数据,可以用于异常检测。
5. 股票市场数据集:这个数据集包含了来自股票市场的多变量时间序列数据,如股票价格、交易量等。这个数据集也包含了一些异常数据,可以用于异常检测。
这些数据集都可以在网上找到,可以用于开发和测试多变量时间序列异常检测算法。
阅读全文