风能预测的科学计量学研究:大数据与人工智能方法综述

126 浏览量更新于2023-12-06 收藏 1.33MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

数据科学与管理5（2022）84评论文章利用人工智能和大数据进行风能预测的新发展：科学计量学见解赵二龙a，孙少龙a，*，王寿阳b，c，da管理学院，Xib中国科学院数学与系统科学研究院，北京，100190c中国科学院大学经济管理学院，中国北京，100190d中国科学院预测科学研究中心，北京，100190A R T I C L E I N F O保留字：风能人工智能大数据分析预测方法A B S T R A C T准确的预测结果对于提高能源效率和降低风能的能源消耗至关重要。大数据和人工智能（AI）在风能预测中具有巨大的潜力。虽然关于这一主题的文献是广泛的，它缺乏一个全面的研究现状调查。在识别风能预测大数据和人工智能方法的演变规律方面，总结了近20年来风能预测大数据和人工智能的研究。结合文献综述和科学计量学方法，对现有的大数据类型、分析技术和预测方法进行了分类和排序。结合当前研究热点和前沿进展，确定了基于大数据和人工智能的风能预测方法的研究方向。最后，本文从不同的角度总结了现有研究的机遇、挑战和启示。研究成果为今后的研究奠定了基础，促进了风能预测的进一步发展。1. 介绍风力发电机产生的风能是一种清洁的可再生能源。随着技术进步和商业模式创新，风电行业发展迅速，装机容量不断增加（Wang等人，2021年）。二零二零年，全球风电装机容量为93吉瓦，较二零一九年大幅增长52. 96%其中，陆上和海上风电新增装机容量对于装机容量较大的风电场，风速变化1 m/s时，发电量波动剧烈。这种波动是由于风力发电量与风速之间的非线性关系因此，及时有效的风能预测对于优化风电场选址和保证可持续能源开发至关重要（Baniketal.， 202 0;Do和So ffker，2021; Niu等人，2018年; Yang等人， 2020年）。然而，由于自然界中风的成因的复杂性和不确定性，风速受到许多因素的影响，例如风向和大气压力（Nikol i'cetal.， 2016;Peng等人， 2020）。此外，风力发电本质上是一个将空气动能然而，到达风电场的空气动能受到许多方面的影响（Fu等人， 2020;Moreno等人， 2021年）。多种因素导致了风力发电的随机性、波动性和间歇性，并使风能预测变得困难（Lledo'etal.， 2019;Malz等人， 2020）。随着科学技术的快速发展，以及对风速设备更新的不断需求，产生、记录、存储和更新了大量与风相关的观测数据（Joselin Herbert等人， 2014; Jiang等人， 2021年）。这些数据来自多个来源，包括数值、文本、图像等多种类型，以及分钟、小时、日等多种频率，被定义为风能大数据。根据风力发电量，主要有两种类型的数据，即，外部数据，如气象卫星数据、相关时间序列、环境变化数据等。以及内部数据，例如由设备产生的图像或数据。与风相关的大数据可以提供足够的数据，而不会产生采样偏差，以帮助研究人员开发新的知识来重塑对风速预测的理解（Fawzy等人，2018; Haupt andBauv i'c，201 7）.基于多源异构数据的风速研究，同行评议由Xi交通大学负责* 通讯作者。电子邮件地址：sunshaolong@X jtu.edu.cn（S. Sun）。https://doi.org/10.1016/j.dsm.2022.05.002接收日期：2022年4月11日;接收日期：2022年5月19日;接受日期：2022年5月21日2022年6月2日在线发布2666-7649/©2022 Xi'an Jiaotong University.出版社：Elsevier B.V.代表科爱通信有限公司公司这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表数据科学与管理杂志主页：www.keaipublishing.com/en/journals/data-science-and-managementE. Zhao等人数据科学与管理5（2022）8485进入大数据时代，为学术界和工业界提供了探索更好风速预测的机会（Hou等人， 2019; Hu等人， 2020; Islam等人， 2013年）。最近，许多研究集中在设计和构建风能预测方法（Jiang等人， 2021; Liu等人，2020; Zhang和Liu，2020）。这些方法分为四种，即统计方法、物理方法、智能方法和混合方法（Qian等人，2019年; Zhang等人，2021年;Zhu等人，2019年）。统计方法通过估计样本的概率分布和随机过程预测风能时间序列值得注意的是，智能方法和基于人工智能的混合方法可以更有效地探索大数据中的复杂关系，并在风能领域提高能源效率，降低能源消耗和实时决策方面发挥重要作用（Hong和Rio Cordorido，2019;Liu等人， 2020; Singh和Dwivedi，2018; Wang，2021）。大数据分析与人工智能技术在风速预测研究中的协同发展，实质性地改变了传统的风速研究。换句话说，在大数据时代，多样化的数据源与概念创新和AI相结合，为准确的风能预测提供了潜力（Devaraj等人，2021;Liu等人， 2021年）。然而，风能预测中的人工智能和大数据研究缺乏系统的文献综述，这是发展该领域不可或缺的。一方面，尽管出版物的数量不断增加，但这一新兴的研究主题仍不为未来研究人员所了解。例如，风速行业使用的大数据的具体类型以及如何使用这些新数据仍然不确定。另一方面，当将大数据与传统数据进行比较时，前者可能具有巨大的信息量和更复杂的结构，从而导致不同的数据特征，侧重于不同的研究问题，需要不同的分析技术（Hou et al.，2019; Neshat等人，2021年）。因此，迫切需要对基于人工智能和大数据的风能预测研究进行全面总结，以利于风能领域的发展，并为未来前景提供本文系统地回顾和总结了数据特征、分析技术、研究热点、面临的挑战和未来的发展方向。具体而言，我们首先调查了风电数据源的多样性和人工智能的发展过程。探讨了人工智能理论与大数据在风能预测中的交叉融合。最后，梳理大数据和人工智能在风能研究中的机遇和挑战。本文的主要目的是回顾大数据在风能研究中的应用。与现有研究相比，本文的主要贡献可以概括为三个方面：（1）据我们所知，这是第一次尝试全面回顾大数据和人工智能在风能预测研究中的应用;（2）不同类型的大数据需要不同的分析技术来解决不同的风能预测问题。本文从数据特征和分析技术的角度对每种类型进行了系统的分析;（3）通过对本研究的调查，详细分析了本研究面临的挑战和未来的发展方向。第二部分界定了本文的研究问题和研究方法。第三部分回答了研究问题。第4总结了前面的内容，以了解机遇、挑战和影响。第5总结本文并讨论其局限性。2. 研究方法在本文中，我们建立了一个循环分析框架，如图所示。 1、全面总结人工智能和大数据研究风能预测。该框架结合了文献综述和科学计量学方法的优势，可以在宏观层面上跟踪研究热点的演变，并发现其特定内容的原因（Yang et al.， 2022; Zhong等人， 2019年）。步骤1：数据收集。利用适当的检索策略，从现有数据库中收集相关领域的相关出版物，并按规则筛选出符合条件的文章第二步：统计分析。对文章进行简单的统计分析，如每年发表的文章数量、作者、发表文章的机构等;第三步：科学计量学分析。分析文章之间的变化和关系，如合作组织、关键词变化，以及利用CiteSpace和VOSviewer进行可视化分析;第四步：文献综述。总结和分析文章，并探索大数据和人工智能如何随着时间的推移而改进。特别是，如图所示。 1、本研究框架从研究问题入手，在回答这些问题的基础上梳理出未来的研究热点。具体而言，我们概述了第三和第四步的关键见解以及相应的分析和讨论。第二步，从统计数据中得出一些研究问题，并在这些研究问题的基础上提出未来的研究方向2.1. 研究问题的定义本文旨在从历史的角度回顾人工智能和大数据在风能预测方法中的总体趋势和演变，并规划未来的发展方向，机遇，挑战和影响。这一目标导致了以下三个目标：（1）对风能领域先进技术的现有研究工作进行分类;（2）确定研究趋势并评估该领域各种研究工作的成熟度;（3）突出未来研究的前景。因此，三个研究问题（RQ）从这些目标出现对这些问题的探讨总结了该领域的实践，指导了未来的工业和学术工作。以下是RQ和依据：RQ 1：在基于人工智能的风能预测研究中，需要考虑哪些类型和来源的数据？理由：本问题旨在确定该研究领域所用数据的类型和来源提出这个问题有助于根据研究中RQ2：大数据和人工智能在风能领域的发展如何？基本原理：该问题考虑了随着技术积累，人工智能方法和大数据技术给风能领域带来的变化。对这一问题的回答有助于研究者对未来的发展方向做出初步判断。RQ 3：风能预测在大数据和AI研究中有哪些热点和前沿演进基本原理：这个问题背后的动机是发现该领域的重大技术进步。回答这个问题将E. Zhao等人数据科学与管理5（2022）8486¼图1.一、研究框架。帮助研究风能预测的基本技术突破，并为该领域遇到的技术变革提供思路。为了尽可能全面地回答上述三个问题，本文采用科学计量学中的文章分析方法，结合文献综述中对研究内容的总结分析此外，研究的第三部分提供了更多的细节。2.2. 数据收集和过滤本文使用了Web of Science（WoS）数据库的核心，包含了从1,900种到现在的约20,000种高影响力期刊。WoS的使用确认了高质量的期刊文章，并确保了研究数据来源的可靠性。特别是利用科学引文索引（SCIE）和社会科学引文索引（SSCI）两个最大的子数据库来收集相关论文。大数据和人工智能在风能预测中的应用是一项跨学科的研究。因此，我们将不会局限于试图涵盖更多结果的论文的科学领域根据 El-Alfy 和Mohammed（2020）的研究结果，我们提出了与大数据、人工智能和风能相关的三组搜索关键词表1列出了每个主题下的搜索关键字这些关键词来源于以往综述研究的检索策略，并在检索过程中逐步添加。WoS中的搜索关键字不区分大小写，* 表示模糊搜索。此外，文献的检索时间设定为2001年至2021年。本文采用WoS的高级搜索功能，使用字段标签，关键字，布尔运算符（OR，AND和NOT）和括号创建查询。OR运算符用于属于同一集合的关键字之间; AND运算符用于关联不同的集合; NOT运算符指示要排除的关键字。搜索策略设置如下：TS（（表1搜索关键字和相应主题的列表对研究的标题、摘要和关键词进行全面检索。本文考虑了语言表达的多样性，以保证数据尽可能全面因此，这种策略会引入大量无关论文，需要进一步筛选。我们根据论文的标题、摘要和关键词手动选择文献。然后，我们通过回顾引言、讨论和结论部分进一步筛选文献。当对任何研究有疑问时，阅读全文并删除不在研究范围内的文章。经过文献筛选，我们获得了210篇已发表的研究，并将其纳入循环分析框架。2.3. 描述性分析2.3.1. 一些出版物出版物数量的统计反映了某一学科领域的研究趋势，而引用次数的统计则反映了该学科的影响力。图图2显示2001年至2021年能源预测领域人工智能和大数据文章的发表和引用数量。虽然我们的综述是对过去二十年的研究，但关于基于人工智能和大数据的风能预测的论文直到2007年才发表此外，从图中可以看出。 2、论文的出版物和被引用次数都在上升。我们直观地看到，论文的出版物和引用数量正在迅速上升。2021年的数据略低于2020年，因为本次研究的数据收集工作截至2021年9月12日，时间样本相对不完整。从发表数量来看，2007年至2017年涉及大数据和AI在能源预测中的研究很少，每年发表的论文不到15篇2018年以来，主题相关主题关键词风相关风电“wind power”, “wind turbine*”, “wind energy*”,“wind farm*”, “wind generation”, “wind systems”,“wind数据大数据技术AI学习”，“神经网络”图2。发表的文章和引文。E. Zhao等人数据科学与管理5（2022）8487相关研究论文迅速增加此外，引文数量也呈现出类似的趋势。通过对论文被引用次数和论文被引用次数的曲线进行拟合，得到了两条趋势线两条趋势线的R2分别为0. 7811和0. 9749，趋势线呈指数增长趋势。这一趋势也证明，能源预测中的AI和大数据研究已经从萌芽阶段进入快速发展期2.3.2. 出版物来源为了比较能源领域期刊的分布，图3显示了一些出版量很高的期刊可以看出，Energies遥遥领先，总出版量为19部，占总出版量的9.048%此外，总出版量为12篇的IEEE Access、Energy12篇和Renewable Energy7篇也是出版量最高的期刊在这些期刊，Applied Energy的影响因子最高，而在IEEE Access上发表的关于风能预测的大数据和人工智能的论文的引用和出版率最高。2.3.3. 研究国图 4比较了不同国家基于大数据和人工智能在能源领域发表的文章数量。根据图在所有国家中，中国出版的出版物最多，有99篇，占出版物总数的31%，其次是美国38篇和英国16篇，分别占出版物总数的11%和5%。此外，图5描绘了第一作者所在国家之间的合作网络。从图中可以看出。中国发表了大量文章，但没有与其他国家进行太多合作。此外，美国、英国和伊朗有着较为密切的合作关系。2.3.4. 科研机构图6显示了科研机构的合作网络。可见，目前能源预测领域融合大数据和人工智能的研究机构分布仍较为分散。中国与美国和英国的研究机构有很多联系。2.3.5. 分析Proli作者发表论文的数量也是衡量作者在该领域研究水平的重要指标。表2列出了排名前13位的作者图三. 十大出版物来源。见图4。不同国家出版物的比例。通过出版物。第一作者是来自德累斯顿工业大学的MosaviAmir，发表过5篇论文。第二、第三作者分别为德国德累斯顿工业大学的Kusiak Andrew和香港城市大学的张子君，共发表论文4此外，其他作者发表了3篇论文。排名前13位的作者中有4位是中国大陆人。3. 研究内容本节主要分析大数据背景下人工智能技术在风能预测中的应用演进如所构建的循环分析框架所示，第2.3节的基本分析结果是对现有文献的初步探索。分析结果有助于回答2.1节中提出的三个研究问题。这使我们能够在清楚了解不同问题之间的关系和可能的研究差距的基础上，确定未来研究的潜在方法和领域。因此，本部分从研究问题的角度对所收集的文章及其发现进行内容如下：3.1. RQ 1：研究数据的类型和来源数据是风能预测的前提如果没有数据，风能预测就没有依据随着风电场设备的不断扩大，产生的数据也变得越来越多样化（Islam等人，2013年）。无采样偏差的数据源可以帮助学术界和工业界更好地了解风能的产生。数据内容从结构化的时间序列到非结构化的文本数据和图像数据，这些数据从各个角度描述了风电场的各个方面。在本次研究中，根据数据来源和数据频率对数据进行了整理，如表3所示。目前，许多研究使用现有的开源数据集进行风能预测。这些开源数据集可以提供一个很好的基准来比较不同方法的优缺点常用的数据集主要有以下几种，如表4所示。如表3和表4所示，现有的研究主要集中在结构化数据上，但对非结构化数据的研究很少。非结构化数据由于其结构不受限制，表现形式灵活多变，使得其采集、处理和分析更具挑战性。此外，非结构化数据主要是内部故障记录和E. Zhao等人数据科学与管理5（2022）8488图五、国与国之间的合作。见图6。科学研究机构合作网络。卫星图像数据中的外部测量数据。自然语言处理和图像识别等人工智能技术的发展，促进了这两类非结构化数据在风能预测中的广泛应用。由于选择风力发电的地点也是一个需要考虑的因素，我们探讨了不同研究人员的研究领域。可以看出，风能预测研究主要集中在沿海或偏远的开放地区，即中国，美国，澳大利亚和土耳其，风资源相对丰富。研究大数据的复杂关系对风能、提高能源利用效率、降低能源消耗具有重要作用消费，并在能源领域做出实时决策。然而，数据量的增加对数据处理技术和条件提出了更高的要求，为风能预测带来了挑战和3.2. RQ 2：研究重点和进展文章的关键词是对研究的高层次总结，对关键词的总结分析可以揭示技术创新的演变过程例如，关键词出现频率越高，该时期的研究热点显示越高。图 7是E. Zhao等人数据科学与管理5（2022）8489表2按出版物排名的前13位作者表4风能相关的开源数据集。作者出版物引文机构数据集位于数据内容网站莫萨维·阿米尔525德累斯顿工业更好的网格区域美国网格拓扑https://db.bettergrids.org/库夏克·安德鲁48爱荷华大学数据bettergrids/社区列表张子俊415香港城市大学DR功率美国全面https://egriddata.org/埃里克·贝赫赫费尔31绿色电力监控系统LLCElia比利时数据平台时间序列数据电子邮件www.elia.be/en/griBenbouzidMohamed内野大卫3358上海海事大学斯特拉斯克莱德大学国家美国全面数据/发电/wind-power-generationhttps：www.nrel.gov/resea基西厄兹古尔326伊利亚州立大学可再生数据平台rch/data-tools.html科利奥斯·阿塔纳西奥斯34斯特拉斯克莱德大学能源李辉312哈尔滨工业实验室马先东39兰卡斯特大学能源美国全面电子邮件www.eia.gov/赛迪地块31突尼斯大学信息数据平台唐振豪31东北电力大学管理Eurostat欧洲全面https://ec.europa.eu/张军339福州大学MyGridGB英国数据平台全面eurostat/web/energy/overview网址：//利用Citespace关键词分析法对2001 - 2021年的研究文献进行分析，得到研究文献中关键词在时间轴上我们根据节点的大小选择前11个关键字其中，频率(1) 数据清洗数据平台www.mygridgb.co.uk/last-28天大数据是最多的从2007年至今，大数据和风力发电机一直是研究热点。2010年开始的特征选择反映了风速预测中影响因素的探索，2015年的不确定性反映了风能预测的预测难度。风速预测、时间序列预测和数据驱动模型是风能的研究方法。其他聚类结果包括参考蒸散量、方位、演化策略、分类和准确率，涵盖2001 - 2021年研究热点的风能预测总的来说，我们发现风能研究主要集中在风能领域的数据和预测方法，特别是通过优化方法提高预测精度。3.3. RQ 3：研究热点与前沿演进明确研究热点和前沿进展，可以为大数据和人工智能在风能预测中将遇到的技术变革提供思路。为了回答RQ 3，我们回顾了所有基于大数据和AI的风能预测研究3.3.1. 大数据相关前沿演进在风能预测中，大数据相关的研究热点和研究进展主要包括数据清洗、特征工程和大数据应用。表3相关数据情况。数据源数据名称类型浮子内部温度测量数据范范电机转速浮动发电浮船破记录应力外部测量数据环境温度浮动风速和风向网侧电源浮子网侧频率浮动网侧电压浮动环境湿度浮子数据清洗是数据采集、校验、处理后的初步处理并验证数据。这是整个数据分析过程中至关重要的环节风能数据中的常见问题包括缺失数据、噪声数据和不一致的数据维度。针对这些问题，常用的数据清洗方法包括缺失值补充、数据去噪和数据归一化。现有清洁方法的实例示于表5中。一般来说，n维数据清洗后，仍然是n维数据。虽然没有产生新的特征序列，但清洗后的数据有助于提高预测模型的鲁棒性。(2) 特征工程特征工程是将原始数据转换为问题的本质更好。特征工程的目的是找到有助于目标的重要特征因此，将这些特征应用于预测模型可以提高模型的预测性能。根据数据的特点，特征工程可分为数据分解与集成技术、特征降维技术和噪声抑制技术。(a) 数据分解与集成技术风速时间序列具有高波动性和非平稳性（Aghajani等人，2016年），这使得用单一模型对原始时间序列进行建模变得具有挑战性。基于分解的方法将原始时间序列分解为不同的子序列，比原始时间序列更有效地建模。数据经过分解后，维度一般都会增加，而每个维度的复杂度都比原始数据要低，这也体现了该方法的“分而治之”思想（Luo et al.2021; Lv和Wang，2022; Qian等人，2019年）。两种最广泛的基于分解的方法是小波和经验模式分解（EMD）。除了这两种常用的分解方法外，软件资产管理（SAM）、可视化分子动力学（VMD）和基础设施数据分类法（ITD）也用于风能预测。这里我们列出了一些有代表性的论文，如表6所示。预测算法可以很容易地发现分解的子风电场经纬度浮子从而找出其内在规律和发展趋势。一般来说，不同的模型需要根据每个模型的特点进行确认。气象数据图像数据子序列，以更准确地预测未来的风速之间E. Zhao等人数据科学与管理5（2022）8490见图7。主引用群集的时间轴可视化。表5数据清理的细节处理后的结果缺失数据插值方法、模式、平均完成时间系列噪声数据小波去噪，离散点检验去噪时间系列（c）减少噪音技术原始数据在产生或记录过程中不可避免地会产生一些噪声数据。降噪技术旨在发现并消除这些噪声数据。数据去噪的目的是减少噪声数据引起的模型误差一种常用而有效的去噪方法是将数据分解成不同的分量，并结合不同的滤波器来滤波异常数据。例如，Akçay和Filik（2017）使用数据数据维度不一致Z分数，标准标度器，归一化，区间标度法极差一致时间序列去趋势、子空间聚类分析等技术，减少缺失值的影响，提高多时段风速预测结果的准确性。(3) 大数据处理技术其中，支持向量机（SVM）和人工神经网络（ANN）等预测方法是最常用的模型（Wu和Xiao，2019）。数据分解可以简化数据，通常需要与预测方法相结合，如SVM和ANN（Wu和Xiao，2019）。预测模型通常是具有不同配置的相同模型。在某些情况下，根据每个子序列的特征选择不同的模型。(b)特征降维技术特征降维技术是指从大量的特征中提取与问题相关的少量特征特征降维技术具有许多优点。它们增加了模型的可解释性，缩短了训练时间，避免了维数灾难，并减少了过度拟合。特征降维技术可分为特征选择和特征提取。特征选择是从观测数据中选择对预测结果有贡献的特征这些特征是原始特征的子集特征选择技术可以归纳为基于相关性、聚类和信息论。特征提取是在分析和发现原始特征之间的相关性后，对原始特征进行线性或非线性组合线性和非线性技术，如主成分分析（ PCA ），自动编码器（ AE ）和线性判别分析（LDA），是两种主要类型的特征提取技术。随着数据呈指数级增长，传统的单一模型在处理大数据时遇到处理速度和效率低的问题，需要开发新技术来更有效地解决这些问题目前，许多大数据技术，如Hadoop、HBase和Hive，用于支持海量数据的存储和计算基于大数据技术，数据存储计算节点可以根据数据增量的大小线性扩展同时，考虑到数据的特点和类型，设计了不同的数据存储方法，以满足不同数据存储的需要。在以往的研究中，很多学者都对大数据技术在风能预测中的应用进行了研究。Arun Jees和Gomathi（2019），Duenas等人。（2018），Galicia et al. （2018），和Xu et al. 本报告（2020）使用两种大数据技术结合机器学习方法研究风能预测，发现应用大数据技术可有效提高单个模型的计算效率。这些研究都指出，风能预测模型与大数据技术相结合是未来的研究趋势。3.3.2. AI相关前沿进展不同的数据需要不同的模型，没有一个模型适合所有的数据。例如，对于一些趋势明显的数据，简单的线性回归可以很好地进行，而不需要很高的操作成本，但对于波动性较大的数据，则需要花费更多的计算时间来采用非线性拟合方法。本节总结了现有文献中使用的不同类型的预测方法，E. Zhao等人数据科学与管理5（2022）8491表6分解方法在风能预测中的应用使用范围方法结果去噪多尺度预处理后处理SAM季节性和趋势性分量分解SSA不同分量信号分析EMD IMF货币基金组织EEMDIMFRes稀疏模式EWT较低和较高频率子序列VMD特定稀疏模式CEMMDANIMFsResResResITD PRCsRes基线信号Res基于小波的低频和高频子序列Res ResRes他们分为四组：统计，物理，智能和混合方法。(1) 统计和物理方法统计和物理方法通过结构化数据预测风速这种方法是最常见和最广泛使用的预测方法;表7列出了三个例子。预测区间的确定对于短期预测来说是相对准确和直接的。然而，该模型需要大量的历史数据作为输入，在长期预测中没有很好的表现。(2) 智能方法智能方法可以分为机器学习和深度学习方法，在表8和表9中进行了总结和回顾。机器学习和深度学习方法首先训练模型，然后对其进行优化，以找到最佳权重，使模型性能更好。然而，深度学习方法通常在计算上更昂贵，而机器学习方法通常更容易推广。智能方法可以结合更多的变量进行高频风能预测。随着处理器的不断更新和迭代以及大量数据的出现，智能方法在风能预测中具有独特的潜力(3) 混合方法混合方法利用了预测模型的优越特性，减少了数据的限制和计算的复杂性，在鲁棒性和准确性方面得到了更好的预测。常用的混合方法可分为两类。第一种方法使用多个模型拟合同一数据集，然后使用加权模型生成预测结果。第二种方法首先对数据进行分解，使用多个模型分别对每个分解数据进行预测，最后对每个预测数据进行加权。如果涉及到超参数问题，则添加一些优化算法来优化超参数。表10列出了关于混合优化方法的几篇文献。文献调研发现，在数据驱动的风能预测领域，上述四种方法中最常用的是智能方法和基于人工智能的混合方法。此外，风能预测可以从预测时间范围分为四类：非常短期、短期、中期和长期（Wu等人，2022; Xiao等人，2021年; Yang等人，2021年）。这四种时间范围是基于预测时间范围，从几秒钟到一天以上的长时间表11显示了具体分类。对于每个预测时间范围，申请地点不同。一般来说，预测周期越短，响应越快，预测时间跨度越大，响应越慢。例如，在涡轮机调节和电力市场清算中使用非常短期的应用，而在相关设备维护计划中使用长期预测。风能的长期预测和短期预测在不同的情景下会产生不同的影响短期和长期预报的优势主要体现在预报效果和应用上。具体而言，较短的预测时间框架可提供更详细及准确的结果，但留给风力发电部署的时间较少。较长的预测时间框架提供了有关未来风能的长期信息，但通常准确性较差（Liu和Chen，2019）。因此，在实际应用中，通常根据应用场景选择合适的数据粒度预测。在得到预测结果后，如何对预测结果和实际值进行度量具有重要意义。找到一个合适的评价指标是至关重要的模型的应用表12列出了风电功率预测中常用的评估指标我们根据适用场景将评估指标分为三类：准确性评估、波动性评估和零指标评估指标。其中，准确性评价指标是最常用的衡量准确性水平波动性评估指标可以衡量预测结果与实际结果之间的偏差。零指标评价指标是一种修正指标，以避免预测中包含许多接近于零的点，这可能导致评价中的偏差。4. 机会、挑战和影响通过回答三个研究问题，我们可以得出结论，技术的发展已经迎来了大数据和人工智能的时代一方面，风力发电厂产生的数据量持续增长。另一方面，随着计算机技术的发展，人工智能算法得到了广泛的应用。大数据和AI为不同风力发电组件的准确预测提供了潜在的解决方案基于上述结论，本部分的主要目标是总结大数据和人工智能背景下风能预测研究所面临的机遇、挑战和启示4.1. 机遇和挑战我们对关键词进行聚类分析，得到211个关键点，1,410个网络连接，网络密度为0.0293，网络模块值为0.5277，表明聚类结果可信。根据图共得到8、11个类，轮廓值的大小反映了轮廓中节点的密集程度和分散程度。E. Zhao等人数据科学与管理5（2022）84921/1N1/1N1/1（RMSE）RMSE¼N1/1i1ypre-yiIA¼PN1/1..香港与里约（2019）CNN四个季度的风速时间序列我很高兴。ypre.y2表7统计方法和物理方法的文献作者模型变量数据频率表11风能预测的时间尺度分类与应用定位时间范围应用地点Rajagopalan和SantosoArma风位置西德克萨斯30分钟，1小时，3非常短期的几秒钟到30分钟涡轮机调节、电力市场清算（二零零九年）2016年：Dowell & PinsonSVARKarakuS et al. （2017）PAR风速风速风澳大利亚H5分钟1小时短期长期30分钟至6小时6小时至1天超过1天预载分担能量分配、电力系统管理相关的维护计划速度设备表8关于机器学习方法的文献。表12评价指标摘要作者模型变量数据位置频率适用场景评价指标方程Cai等人SVR SCADA，天气汽轮机1 h精度平均绝对误差（MAMAE¼1XN . 伊普雷岛。（2020年）Lahouar和预测数据RF风速，突尼斯10分钟平均绝对百分比误差联系我们1XN. 预-是的本·哈吉电影Slama（2017）方向（MAPE）均方误差（MS我是我MSE¼1XNypre-yiDemolli等人RFR，风速，风功率温度，Nigde，1 h土耳其布什尔，5分钟，均方根误差r1XN2N（2018年）（径向基函数）相对压力伊朗分钟，30分钟，平均偏倚误差（MBE）MBE¼1XNypre-yi湿度，当地时间和1h误差平方和（SSE）SSE¼PN ypre-yi波动评价标准差（SD）SD/s标准差（前-后）表9关于智能方法的文献。泰尔r1XN2N作者模型变量频率rZhu等人（2019）LSTMAWS，PWS，DPT，RH，SH，SP，SLP，APWang等人（2018）DBN风速，风向，总数15分钟10分钟零索引评价一致性指数（IA）N前1/4PNypre-yii¼1iMadhiarasan和发电量数据MLP温度，风向，每日1小对称平均错误我是你的朋友。ypre-y.2XN。伊普雷岛。Deepa（2017）相对湿度、风速绝对百分比sMAPE¼N1..注：yi是真实值，ypre是预测值，y是实际系列，N是样本数表10关于混合优化方法的文献作者型号数据位置频率我们分析了与风能预测相关的聚类结果集群#0的标签是Li等人（2018年a）VMD-ELM Sotavento Galicia，西班牙; DabanCity ，中国 ;InnerMongolia，中国10分钟，15分钟分钟，30分钟整个研究期间的热点集群#1的标签是由风力涡轮机产生此外，聚类#2特征选择Chen等人（2021年）Wang等人（2017年）EEMD-GA-LSTM美国印第安纳州5分钟WD-CNN银河风电场5分钟反映了风速预测中产生的数据的选择第3组的不确定性说明了风速预测中风速不确定性的困难此外，群集#4、5和7，时间Liu等人（2018年a）EWT-LSTM-Elman中国1小时系列预测、风速预测和数据驱动模型，Wang等人（2015年）SVR，Elman新疆维吾尔自治区中国区每日分别用于风速预测模型的探索。聚类#4反映了对准确率的关注图9显示，Li等人（2018年b）Liu等人（2018年b）EMD-BA-BPNN，ENN，ARIMAMOGWO-WPD-AdaBoost，MRT- ORELM蓬莱，中国10分钟新疆维吾尔自治区日报在对进化优化策略的研究和分析中可以看到进化策略。从图8中，我们可以看到风速预测的演变。具体而言，我们从以下几个方面总结了本文的主要研究热点：Peng等人（2020年）WSTD-GRU美国4个站点1小时关键词，并发现数据和预测方法是主要的专注于这个领域。这种现象可能是遇到的不确定性Li等人（2020年）SSOFC-Apriori-WRP突尼斯日报风速预测。在风中遇到的困难，评价（2019年）Khosravi等人XGBoostSVRi1ypre-yi系数（TIC）TICE. Zhao等人数据科学与管理5（2022）8493Santhosh等人（2019年）Wang等人（2016年）EEMD-DBMTelangana，印度;Tamilnadu，印度WT-DBN-QR中国广东省澳大利亚悉尼10分钟1小时在风能预测方面，我们可以从大数据入手，结合风速产生过程的特点，结合丰富的时间序列预测方法，对风能预测进行更深入的研究这也可能是未来风能开发的热点E. Zhao等人数据科学与管理5（2022）8494图八、关键词共现分析4.2. 影响：未来方向本研究从大数据和人工智能的角度总结了现有的知识库，发现了风能预测的研究热点和前沿进展基于大数据和人工智能的研究成果，我们从数据和人工智能预测技术两个方面展望风能预测的未来发展E X公司对大数据的研究主要集中在探索结构化数据，比如风速。然而，随着风力发电厂技术变得越来越复杂，越来越多的非结构化数据，如电机温度数据和卫星图像数据变得可用。目前对这类数据的研究较少，但这类数据对于有效及时地进行风速预测具有很大的潜在应用价值。此外，由于不同数据源带来的挑战，如何利用多模态数据进行预测也值得研究。此外，在数据预处理中，不确定一种方法优于另一种方法。从预测方法的角度来看，现有的方法大多采用混合方法，可以从单一模型获得优异的预测性能但是，混合方法需要对各种分解和预测方法有深入的了解，这需要进行大量的基础研究。此外，此类方法的可解释性相对较弱，不易发现数据背后的直接启示。未来风能预测的研究可以集中在探索可解释的深度学习方法上。在实践中，数据的增加和人工智能的进步有助于提高风能预测的准确性。然而，风速的复杂性以及预报模型的不确定性与预处理模型的不确定性之间的不一致性，限制了数据处理方法的应用基于大数据和人工智能的风能预测模型的设计和应用可以有效提高风速预测精度。5. 结论和局限性风能是由风驱动的清洁能源，风能的利用可以缓解能源危机。然而，风的随机性和复杂性给稳定供电带来了巨大的挑战风能供应大数据和人工智能的发展为风能预测带来了突破。为了探索大数据背景下人工智能在风能预测中的研究进展，根据研究内容选择了WoS中所需首先，本文旨在识别大数据和人工智能快速发展在风能领域的机遇、挑战和影响，以及未来发展方向。其次，基于这一目的，提出了三个研究问题。最后，本文结合文献综述和科学计量学的优势来回答这些问题，并概述了该领域的当前实践。本文通过对文献的总结，发现风能预测研究中主要有四种预测模型。每类模型所要求的模型输入和预测精度都有差异，不同的模型各有优缺点。而且，风能数据的研究主要集中在智能和混合方法上，可以结合大数据分析和挖掘技术，获得优异的预测性能。总的来说，风能预测是一个有意义和具有挑战性的研究课题。本文向研究人员全面总结了大数据和人工智能在风能预测中应用的过去、现在和未来。研究内容包括数据的来源、数据的预处理、数据的特征工程、机器学习、深度学习算法以及相应的改进效果。本文为从事风能大数据和人工智能应用的研究人员提供了指导。但是，本文仍有一定的局限性。首先，本研究所用的论文数量有限，后续可以对更多的论文进行总结。其次，我们主要专注于用大数据和AI处理时间序列数据虽然它缺乏非结构化数据的应用，但研究人员可以研究这种非结构化数据对风能预测的影响竞合利益作者声明不存在利益冲突E. Zhao等人数据科学与管理5（2022）8495致谢本研究工作得到了国家自然科学基金（批准号： 72101197 和71988101）和中央大学基础研究基金（批准号：SK2021007）。引用Aghajani，A.，Kazemzadeh河，Ebrahimi，A.，2016.提出了一种基于小波变换、混合神经网络和帝国竞争算法的风电场发电量预测方法。能量转

下载后可阅读完整内容，剩余1页未读，立即下载