并行K-Means算法在电力负荷聚类中的应用研究

需积分: 0 120 浏览量更新于2024-08-05 收藏 2.05MB PDF 举报

"基于改进的并行K_Means算法的电力负荷聚类研究_许元斌2" 在电力行业中，随着我国经济的快速发展，电力系统的规模和复杂性日益增加，这给电力负荷管理带来了巨大的挑战。电力企业的核心任务是确保电网的安全稳定运行，并提升经济效益。在这样的背景下，对电力系统负荷数据进行有效的分析和划分显得尤为重要。数据挖掘技术中的聚类分析是一种常用的方法，特别适用于电力负荷数据的分类。聚类能够将相似的负荷数据归为一类，帮助识别负荷模式，以便于优化电网规划、设计和运行。传统的K-Means算法是一种广泛应用的聚类方法，它通过迭代过程将数据分配到不同的簇中，以最小化簇内数据点间的平方误差和。然而，由于电力负荷数据量通常极大，传统的K-Means算法在处理这类大数据时可能会遇到计算效率低和收敛速度慢的问题。针对这一问题，许元斌等人提出了一种基于改进的并行K-Means算法。并行计算是解决大数据问题的有效途径，通过分布式计算资源可以显著加快算法的执行速度。在改进的算法中，可能包括了初始化策略的优化、距离度量的调整或是更高效的簇中心更新机制，这些改进旨在提高算法的准确性和效率。该研究中，作者可能采用了如下的策略：首先，利用并行计算框架（如MapReduce或Spark）将大规模负荷数据分布式处理，减少单个计算节点的压力；其次，可能对K-Means的初始中心选择进行了优化，比如采用K-Means++方法来避免陷入局部最优；再次，可能引入了更适应电力负荷特性的距离度量，比如考虑时间序列的相似性或非线性关系；最后，通过有效的数据通信和同步策略，确保并行过程中的结果一致性。论文《基于改进的并行K-Means算法的电力负荷聚类研究》详细探讨了这些改进措施，并对其性能进行了评估。通过实验对比，作者可能展示了改进后的并行算法在处理电力负荷数据时相比于传统K-Means在聚类质量和计算速度上的优势，进一步证明了该方法在电力系统负荷分析中的实用价值。总结来说，这项研究旨在通过改进的并行K-Means算法，提高电力负荷聚类的效率和准确性，以支持电力企业的决策制定和电网的高效运营。这种算法的实施对于电力系统的现代化管理和智能电网的发展具有重要的理论与实践意义。

Computer Engineering and Applications计算机工程与应用

2017，53（17）

1 引言

随着我国的经济的蓬勃发展，电力系统的结构变得

越来越复杂，导致了电力负荷规模愈加庞大。如何提升

电网的安全性、稳定性以及如何提高经济效益已成为电

力企业关注的问题。在电力企业的生产经营和管理中，

对电力系统负荷数据有效划分是重中之重的工作环节，

也是基本工作环节之一

[1]

。建立符合实际的动态负荷模

型对电力系统规划、设计和运行等诸方面均有十分重要

现实意义。对电力负荷数据的分类可以使用数据挖掘技

术中的聚类分析。聚类是将物理或抽象对象的集合分

基于改进的并行 K-Means 算法的电力负荷聚类研究

许元斌

，李国辉

2，3

，郭昆

2，3

，郭松荣

2，3

，林炜

2，3

XU Yuanbin

, LI Guohui

2，3

, GUO Kun

2，3

, GUO Songrong

2，3

, LIN Wei

2，3

1. 国网信通亿力科技有限责任公司，福州 350001

2. 福州大学数学与计算机科学学院，福州 350116

3. 福建省网络计算与智能信息处理重点实验室，福州 350116

1.State Grid Electic Power Company, Fuzhou 350001, China

2.College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350116, China

3.Fujian Provincial Key Laboratory of Network Computing and Intelligent Information Processing, Fuzhou 350116, China

XU Yuanbin, LI Guohui, GUO Kun, et al. Research on parallel clustering of power load based on improved K-

Means algorithm. Computer Engineering and Applications, 2017, 53（17）：260-265.

Abstract：The electrical power enterprise usually based on power load data, uses the traditional K-Means algorithm to

classify the customers, but the biggest drawback of this method must be specified by the user manual clustering number of

clusters. It proposes a method combining Canopy algorithm and K-Means algorithm based on load clustering, without the

need to manual ly specify the number of cl usters, the automatic division of th e customer. First of all, it collects users’

electrici ty data, uses the parallel computing framework MapReduce to preprocess the original data. Then, it uses Canopy

and K-Means algorithm to establish the clustering model of automatic load. Finally, in the real consumption data on the

empirical analysis, by using the Silhouette index to evaluate, it shows that the proposed method is more stable and conve-

nient, and has wider applicability.

Key words：load clustering; parallel computing; Canopy; K-Means

摘要：电力企业通常根据电力负荷数据，采用传统的 K-Means 算法对客户进行划分，而这种方法最大的缺陷就是

必须由用户手动指定聚类簇数。提出了一种将 Canopy 算法和 K-Means 算法结合应用于负荷聚类的方法，无需手动

指定聚类簇数。收集到的用户历史用电数据，使用并行计算框架 MapReduce 对原始数据进行预处理。应用 Canopy

和 K-Means 算法建立自动负荷聚类模型。在真实用电数据上进行实证分析，通过使用 Silhouette 指标对结果进行评

估，证明提出的方法更加稳定和具有广泛的适用性。

关键词：负荷聚类；并行计算；Canopy；K-Means

文献标志码：A 中图分类号：TP311 doi：10.3778/j.issn.1002-8331.1603-0110

基金项目：国家自然科学基金（No.61300104）；福建省科技创新平台建设（No.2009J1007）；福建省自然科学基金（No.2013J01230)；

福建省高校杰出青年科学基金（No.JA12016）；福建省高等学校新世纪优秀人才支持计划（No.JA13021）。

作者简介：许元斌（1970—），男，高级工程师，研究领域为电力行业信息系统自动化；李国辉（1992—），男，研究领域为大数据挖

掘，E-mail：823896856@qq.com；郭昆（1979—），男，博士，副教授，研究领域为大数据挖掘；郭松荣（1991—），男，硕士，

研究领域为大数据挖掘；林炜（1992—），男，硕士，研究领域为大数据挖掘。

收稿日期：2016-03-08 修回日期：2016-06-23 文章编号：1002-8331（2017）17-0260-06

CNKI 网络优先出版：2016-12-07, http://www.cnki.net/kcms/detail/11.2127.TP.20161207.0935.002.html

260

下载后可阅读完整内容，剩余5页未读，立即下载

梁肖松

粉丝: 32
资源: 300

并行K-Means算法在电力负荷聚类中的应用研究

基于改进的并行K_Means算法的电力负荷聚类研究_许元斌1

基于改进K_means算法的聚类分析研究

基于LDA的改进K_means算法在文本聚类中的应用

K_means算法的初始聚类中心的优化

基于K_Means的文本层次聚类算法研究

主动半监督K_means聚类算法研究及应用_吕峰.caj_基于K-MEANS_半监督百万级数据师生模型_K._聚类算法_聚类_源

改进并行K-Means算法在电力负荷聚类中的应用研究

fuzzy-K-means.zip_K._fuzzy k_模糊聚类分析_聚类性能_聚类算法

hing_wp10.zip_K._PSO负荷聚类_聚类 负荷_聚类 负荷预测_聚类预测

基于并行遗传算法的K_means聚类研究

最新资源

hing_wp10.zip_K._PSO负荷聚类_聚类负荷_聚类负荷预测_聚类预测