掘方法进行融合分析和深度挖掘, 从数据内在规律分析的角度发掘出对电力设备状态评估、
诊断和预测有价值的知识, 建立多源数据驱动的电力设备状态评估模型, 实现电力设备个性
化的状态评价、异常状态的快速检测、状态变化的准确预测以及故障的智能诊断, 全面、及
时、准确地掌握电力设备健康状态, 为设备智能运检和电网优化运行提供辅助决策依据。电
力设备状态大数据分析是传统数据挖掘技术的提升和变革[5], 核心优势是从全量数据中提
取客观规律, 不需要建立复杂的物理数学模型, 主要应用价值体现在:
1) 从数据分析的角度揭示电力设备状态、电网运行和气象环境参量之间的关联关系和
内在变化规律, 捕捉设备早期故障的先兆信息, 追溯故障发展过程, 预测故障发生的概率,
从而及时发现、快速诊断和消除故障隐患, 保障电力设备运行安全。
2) 利用多维统计分析、关联分析、机器学习等方法获得不同条件、不同维度电力设备
状态变化的个性化规律, 实现多维度、差异化的全方位分析, 大幅提高电力设备状态评价和
预测的准确性。
3) 推动新一代信息技术与设备运维检修的深度融合, 实现多源海量数据的快速分析、
主动预测预警和故障智能研判, 提升设备状态评估的效率和智能化水平。
1.2 数据来源和特征
电力设备状态大数据分析所需要的数据主要包括:设备台账、技术参数、巡检和试验数
据、带电检测和在线监测数据、电网运行数据、故障和缺陷记录、气象信息等, 涵盖能够直
接和间接反映电力设备状态的信息。根据电力设备状态信息的更新频率, 可以将上述不同来
源的状态信息划分为 3 大类:静态数据、动态数据、准动态数据。静态数据主要包括设备台
帐、技术参数、投运前试验数据、地理位置等;动态数据通常按分钟、小时或天为周期更新,
是反映设备状态变化的关键数据, 主要包括运行数据、巡视记录、带电检测数据、在线监测
数据、环境气象等;准动态数据通常按月或年定期或不定期更新, 主要包括检修试验数据、
缺陷/故障/隐患记录、检修记录等。
电力设备状态数据具备典型大数据特征, 传统的数据处理和分析技术无法满足要求, 主
要体现在:1) 数据来源多。数据分散于各业务应用系统, 主要来源包括设备状态监测系统、
生产管理系统 (统 (production management system, PMS) 、能量管理系统 (energy
management system, EMS) 、地理信息系统 (geographic information system, GIS) 、天
气预报系统、雷电定位系统、山火/覆冰预警系统等, 各系统相对独立、分散部署, 数据模
型、格式和接口各不相同;2) 数据体量大、增长快。电力设备类型多、数量庞大, 与设备状
态密切相关的智能巡检、在线监测、带电检测等设备状态信息以及电网运行、环境气象等信