太阳能模型的发展及其在能源方面的应用

96 浏览量更新于2024-01-22 收藏 1.35MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

能源与人工智能12（2023）100226以中欧为例的E. Schlager，G.Feichtinger，H.居尔施Know-Center GmbH，Inffeldgasse 13/6，8010 Graz，AustriaH I G H L I G H T S• 非分段分离模型的发展。• 线性、逻辑和组合分离模型的比较。• 与全局和重新参数化的Engerer模型的比较。• 深入评估季节性影响和短途运输能力。• 使用多项式项的正则化线性模型最好达到3阶。G R A P H I C A L A B S T R A C TA R T I C L E I N F O数据集链接：https：//bsrn。阿维岛De保留字：太阳辐照度直接法向辐照度太阳分离模型太阳回归太阳能模型可转移性A B标准太阳辐射影响许多不同的领域，如能源生产，农业和建筑运营。因此，这些领域的模拟模型通常依赖于有关太阳辐射的精确信息。测量通常仅限于全局辐照度，因此其单个分量（直接辐照度和漫射辐照度）的测量很少。然而，直接和漫射辐照度的信息对于模拟模型可靠地工作是必要的。在这项研究中，太阳能分离模型开发使用10分钟的训练数据从两个不同的地点在奥地利。直接水平辐照度通过使用几个目标函数回归直接分数来预测。首先在包括来自两个位置的数据的数据集上训练模型，并对测量和估计的直接法向辐照度的均方根偏差（RMSD）、平均偏差偏差（MBD）和决定系数（R2）进行表现最佳的这项工作是由欧盟委员会资助的美国国防部项目（编号101070076）和由欧盟委员会资助的COMFORT项目（编号867533）的一部分。奥地利研究促进局（FFG）。知识中心由奥地利联邦科学技术委员会赞助的奥地利COMET计划-优秀技术能力中心-资助。气候行动、环境、能源、流动、创新和技术部（BMK）、奥地利联邦数字和经济事务部（BMDW）和施蒂里亚州COMET由奥地利研究促进机构FFG管理∗ 通讯作者。电子邮件地址： elke@schlager.bz（E. Schlager），feicht@gmx.at（G. Feichtinger），hgursch@know-center.at（H.Gursch）。网址：http://www.know-center.at（E.Schlager）。https://doi.org/10.1016/j.egyai.2022.100226接收日期：2022年9月13日;接收日期：2022年12月13日;接受日期：2022年12月15日2022年12月19日在线提供2666-5468/© 2022作者。出版社：Elsevier Ltd这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）。可在ScienceDirect上获得目录列表能源与AI期刊主页：www.elsevier.com/locate/egyaiE. Schlager等人能源与人工智能12（2023）10022621. 介绍然后选择模型进行进一步分析。该分析包括对每个季节的模型进行评估，奥地利两个地点之间训练模式的可转移性，中欧四个地点的可转移性和可推广性研究，以及与值得信赖的Engerer模型的比较。太阳能分离模型与多项式项高达三阶和岭正则化优于第二个模型的基础上的逻辑项与混合二次项相结合，以及Engerer模型。为了正确量化由太阳辐照引起的热增益，必须将全球水平辐照度分成其直接水平辐照度和漫射辐照度的分量，因为两者以不同的方式影响热发展[8]。与直接和漫射分量的更复杂和昂贵的测量相比，全局辐照度可以轻松且经济地测量[9]。因此，整体辐照度测量设备比直接和漫射辐照度测量设备在更多的位置可用。例如，在奥地利，全球辐照度与其他天气数据一起测量，260个地点[10]，而直接和扩散分量仅在奥地利气象和地球动力学中心（ZAMG）的六个地点[11]进行测量。此外，许多台站以10分钟的采样率提供采样或汇总的数据。减少数据量和提高数据质量的措施，如平均或删除离群值。这不仅适用于奥地利，也适用于其他国家[12因此，表征直接和漫射辐照度的值通常来自基于全局辐照度计算直接和漫射辐照度的分离模型，也可能是其他量，如太阳高度，表观太阳时，气温和云量[15自20世纪60年代初以来，这种分离模型一直在发展[18]。从那时起，不仅需要知道直接和漫射辐照度的增加，而且需要更高的时间分辨率，因此也需要测量数据的采样率。虽然早期的模型是基于每小时甚至每天的数据[15，17-测量数据的时间分辨率影响数据的性质，因此影响模型，因为云增强效应在1分钟或10分钟数据中比在每小时数据中丰富得多。因此，基于每小时数据开发的模型在采样率较小的数据上表现不佳[24]。本工作的重点是开发适用于建筑物热控制系统的分离模型。来自透过窗户传输的太阳辐射的热增益是建筑物中热通量的主要来源之一，除了内部热增益，包括建筑物操作和居住者，由于通风和渗透引起的对流热通量，以及通过不透明建筑围护结构的传导热传递[25]。太阳辐射对室内条件的影响在很大程度上取决于窗户面积及其方向，并且可以通过百叶窗轻松有效地进行阻尼[26，27]。目前确保热舒适的能量模拟模型大多使用每小时数据进行[26，28Berouine等人。[32]提出了一个使用15分钟数据的热动力学模型，使用全球太阳辐射来模拟热量增加，而不是其直接和漫射分量。因此，如所提供的，约10分钟的时间分辨率许多气象站，是足够的最新热控制系统的模拟。描述了四种不同类型的分离模型，并训练了这四种模型类型的16个子变量。这16种变化是根据奥地利辐射提供的格拉茨和克拉根福的准确的太阳辐照度值对于许多不同的应用领域都很重要，包括能源、农业、建筑和建筑操作[1 人类感受到的热舒适度特别受到户外和建筑物中太阳辐照度的影响。虽然有明显的直接辐照影响，如热量增加，但也有不太明显的间接影响，如智能建筑系统触发的自动遮阳[5在监测网络ARAD [11]。数值评分，如均方根偏差（RMSD）、平均偏差（MBD）和决定系数（R2）、预测质量的视觉评估和模型复杂性用于5倍交叉验证以选择两个模型用于进一步评估。第一个模型基于多项式项，在训练过程中使用岭正则化，最高可达三阶，而第二个模型结合使用逻辑项命名法��A��你好，你好��你好，你好��你好，你好��缩写ARADBSRNLINKLOGLINKmaxADMBDMIXEDPCAPCAkR2RIDkrMBDRMSDrRMSDTAWESWMOZAMG相对湿度（%）持久性（直接水平部分（估计直接水平辐照度（Wm−2）直接法向辐照度 (Wm−2）估计的直接法向辐照度（Wm−2）全球水平辐照度（Wm−2）清晰度指数（-）日平均晴朗指数（日照时数（s）气温（°C）天顶角（° C）奥地利辐射监测网基线地面辐射网Logistic模型最大绝对偏差平均偏差混合二次Logistic模型主成分分析线性模型PCA决定岭正则化线性模型相对均方根偏差世界气象组织（气象组织）奥地利气象学和地球动力学中心E. Schlager等人能源与人工智能12（2023）1002263混合二次项。这两个模型的变体进行了更详细的调查，关于两个奥地利城市格拉茨和克拉根斯堡的季节性和空间可转移性使用的汇总数据，在10分钟的时间间隔。最后，从基线地面辐射网络[33]获得了来自欧洲但奥地利以外的测量站的数据，以测试奥地利周围位置的空间可转移性，同时考虑到未来的当地适用性，并表明开发的模型适用于其他数据源。为了对现有模型进行验证，在本工作中使用的所有六个地点对Engerer模型[34]的全局重新参数化进行了测试。此外，Engerer模型被重新参数化（即，例如，以获得每个站点的本地Engerer模型），并在每个站点上分别进行测试。虽然Bright和Engerer [34]证明Engerer模型具有良好的全局整体性能，但在位置方面进行评估时，与所提出的模型相比，差异更大。岭正则化的三阶多项式模型被证明是最好的整体模型，因为它在模型复杂性、预测质量、可转移性、可解释性、未来改进和应用潜力之间提供了良好的折衷。结果指出了朴素多项式模型在应用时优于可信的Engerer模型一个有限的区域。第2节介绍了以前的工作领域的全球辐照度分裂成其直接和漫射辐射分量。接下来是关于数据的详细讨论，它的预处理，以及在第3节中选择的这项工作的方法。第4节介绍实施方法的分离性能，包括季节性和可转移性评估。本出版物最后以第5节是结论，第6节是对未来工作和可能应用的展望。2. 相关工作关于辐照度分离的文献相当丰富。绝大多数分离模型是使用线性回归的数据驱动方法，具有分段和非分段多项式目标函数[15，19，35还有物理模型[40]，混合模型[41]和基于机器学习的模型，如支持向量机[42]，梯度提升[23]，或人工神经网络[43，44]，后者的方法更常见于预测或预报的整体辐照度比辐照度分离[45]。辐照度分离模型通过利用以下关系将全局辐照度分解为两个分量，漫射辐照度和直接水平辐照��度或直接法向辐照度��=��+��,ℎ,with(1a)��,ℎ=��,��⋅ sin(90° − ),(1b)太阳天顶角。从Eqs。根据公式（1a）和（1b），可以得出，预测最大值，最小值，最小值或最小值，最小值就足以分解最大值，因为其他分量可以相应地计算。��是由地理纬度、太阳赤经和时角得出的，而后者取决于时间和地理-经度。根据地外辐照度，计算出清晰度指数[46]，并由此推导出清晰度指数为�� 为��闪烁清晰度指数作为主要的，有时是唯一的，预测变量的各种模型估计直接或漫射辐照度。估计主要是通过Liu和Jordan[18]，Orgill和Hollands [19]，Erbs等人[35]的作品中的分数解决方案来完成的，其中扩散分数��，i. 例如，使用α-β预测α-β-γ-γ-δ与α-β-β-γ-δ的比率。或者，一些模型计算直接法向分数，i。例如，��[47 ]第47话，我的意思是，直接预测直接辐照度的模型方法没有一部分解决方案是非常不受欢迎的，但也被开发出来，e. 例如，在一个实施例中，Boes [48].选择一个分数作为目标变量，而不是辐照度本身构成了预测任务的变化。使总辐照度测量值和预测值之间的误差最小化的模型不同于使测量的辐照度分数和预测的辐照度分数之间的误差最小化的模型。在实际应用中，辐照度值的可靠估计往往优于正确的分数。这促使使用直接辐照度作为目标变量，如Boes [48]中所做的那样。然而，使用像太阳-地球运动这样的分数考虑了太阳-地球运动引起的辐照度值的季节性变化除了目标变量的选择外，模型还依赖于作为其输入变量的测量数据的可用性。许多模型使用清晰度指数作为其唯一的预测因子[24，表1]，因此适用于全球辐照度已知的任何地方。��但是，依赖于平均值作为唯一预测器的模型无法捕捉到数据中的传播，正如Ridley等人所解释的那样。更复杂的模型除了引入晴空指数外还引入了其他变量，如Skartveit和Olseth [36]将太阳高度作为预测变量，Ridley等人[16]将太阳高度、视太阳时（A）、每日晴空指数（DRR ）和持续性（DRR）纳入模型，Engerer [13]使用基于晴空指数（DRR）和晴空指数（DRR）的晴空指数。��包括这些变量是为了提高模型性能，而不需要额外的测量，因为这些量只来自全球辐照度和时间，分别。Reindl等人的研究。[15]使用较少的预测变量，但通过额外测量空气温度（）和相对湿度（）来增强他们的模型。��Furlan等人[17]更复杂的工作包括基本的气象测量，如空气质量和空气压力，但也包括更精细的测量，如大气污染，云量和云类型。��包括仅由少数测量点捕获的这些变量大大限制了模型对其他位置的适用性。Furlan等人[17]还包括季节作为预测因子，即。例如，无论是雨季还是旱季，作为捕捉季节性影响的简单方法。Rerhrhaye等人。[49]发现，通过分别在季节上训练模型，一整年的模式。这种方法使用了一个分段线性二次模型，清晰度指数作为其唯一的预测因子，将一年的时间分为夏、春、秋、冬三个时期。相反，Boland等人[38]通过包括天顶角和地外辐射来考虑季节影响。然而，该模型是基于清晰度指数作为唯一的预测，因此，天顶角和地外辐射只是间接地包含在模型中，因为清晰度指数是由天顶角和地外辐射得出的。在Khalil和Shaffie [50]对几种模式的比较研究中，作者指出了埃及开罗空气中云模式和尘埃颗粒的季节差异的特殊性，这可能会影响模式的性能。相比之下，Liu等人[12]显示中国北方两年数据的扩散分数季节变化不明显。因此，在模型中包括关于季节的信息的益处，或每个季节训练模型的时间取决于感兴趣位置的季节性辐射强度和天气变化以及模型中使用的变量，因为一些变量（如清晰度指数）已经捕获了一些季节性变化。数据驱动的分离模型通常使用与特定地点测量值拟合的参数。许多以前的出版物调查的位置的影响和现有的模型的可移植性。为了建立适用于具体区域（最好是大区域）的可靠模型，需要一个分类方案，将土地划分为气候条件相似的不同虽然有广泛使用和接受的气候带分类系统，如Gueymard和Ruiz-Arias [24]和Abreu等人[22]考虑了全球四个不同的气候带-干旱，温和，热带和高干旱，并评估了E. Schlager等人能源与人工智能12（2023）1002264Fig. 1. ARAD/TAWES（红色）和BSRN（蓝色）的测量部位，标记大小指示位置高程。Stamen Design的地图，CC BY 3.0。数据来自OpenStreetMap，ODbL。（有关本图例中颜色的解释，请参阅本文的网络版本基于单个测量点数据的区域特定模型。然而，这种区域特定模型的性能在一个气候带内的不同位置变化很大[24]。Bright和Engerer [34]根据全球数据重新参数化Engerer模型[13]，并根据五个不同的区域（赤道、干旱、温带、寒冷和极地）评估模型。虽然不建议将由此产生的全球模式用于极地气候，但该模式没有再次跳过极地数据重新参数化。Starke等人。[37]比较了全球模型、拟合简单和完整Köppen-Geiger分类的模型以及拟合每个位置的模型。Zhou等人[53]将中国分为五个不同的区域，这是根据刘等人[54]描述的基于日全球太阳辐射的分类进行修改的，用于开发估算日漫射辐射的模型。Ascencio-Vásquez等人[52]提出了一个气候分类系统，使用12个不同的区域来评估全球光伏系统的性能。因此，广泛使用的Dervishi和Mahdavi的工作[55]评估了几个sepa，定量模型的测量数据库从维也纳，奥地利。八个模型首先进行评估，没有校准到维也纳的数据，只有三个表现最好的模型进行评估后，校准到维也纳的数据。由于模型检查了来自不同位置的原点，因此在来自不同位置的数据集上进行了训练，因此在没有校准的情况下对模型的评估可能会有偏差。作者观察到只有一个小的改进后，校准的三个模型。因此，对于仅在奥地利的应用，为了更高的准确性，可能会降低模型的泛化能力。这促使目前的工作审查的需要和额外的好处的模型校准到奥地利境内的不同地点除了选择哪一个数量是仿照第一宫，我。例如，直接部分、漫射部分或直接辐照度，也可以基于不同的量来评估模型。Qin et al.[56]，Gueymard [57]，Boland et al.[47]根据以下情况进行评估��，��和，��。然而，其他人评估模型的方面，漫射分数[12，16，17]或漫射辐照度[13，53，55，58]，限制了不同出版物中结果的可比性此外，所使用的性能指标也各不相同。虽然Liu等人[12]，Zhou等人[53]，Lou等人[58]使用绝对误差测量（如平均绝对误差，平均偏差偏差（MBD）和均方根偏差（RMSD））评估模型性能，但Dervishi和Mahdavi [55]以及Engerer [13]使用相对测量，如相对平均偏差（rMBD）和相对均方根偏差（rRMSD）。Qin等人。[56]使用绝对测量MBD和RMSD，以及它们的相对对应物rMBD和rRMSD，以及决定系数2来计算全局性能指标（GPI）。类似地，Zhou等人。[53]根据以下公式计算GPI：四个测量2，RMSD，MBD和平均绝对偏差误差，而Despotovic等人。[59]包括十个不同的测量来计算a全球和平指数。这项工作介绍了几个新的模型，所有这些都是基于多项式和逻辑函数，分别像文献中发现的绝大多数模型。文献中的模型通常侧重于使用大量的测量数据，或者相反，使用非常少的测量数据，但使用许多额外的计算量，例如A，λ和λ。��手头的工作寻求测量数据和补充计算数据之间的良好折衷。3. 材料和方法3.1. 测量和数据准备数据驱动模型通常在很大程度上取决于数据的可用性和质量。尽管如此，预处理和清理程序对于确保数据质量至关重要。 Long和Shi [60]的工作描述了QCRad方法在美国大气辐射监测计划中测试辐射数据中的异常值。在Engerer [13]中，这些例程中的一些以适应的形式应用，因为所使用的数据值限制是基于由进一步约束补充的现场特定观察。在Gueymard和Ruiz-Arias [24]中，基于与[61，62]的上述作品相同的条件，开发了更严格的约束。然而，所有这些后验质量控制假设数据来自小心操作的测量站点，例如。例如，在一个实施例中，根据世界气象组织（WMO）基线地面辐射网络（BSRN）的标准[33]。测量数据本研究中使用的数据集涵盖了来自六个不同地点的测量点，并从不同来源获得。概述见表1，测量部位的可视化见图1本研究中的主要训练和测试数据集包括来自ARAD数据集[11]的辐射数据和E. Schlager等人能源与人工智能12（2023）1002265|()|表1纬度和经度（以度为单位）、海拔（以米为单位）以及所考虑的测量地点的数据来源。纬度经度高程源奥地利格拉茨47.08 15.45 367 ARAD TAWES奥地利克拉根堡46.65 14.32 450 ARAD TAWES卡堡，荷兰51.97 4.93 0 BSRN林登贝格52.21 14.12 125 BSRNPayerne，瑞士46.82 6.94 491 BSRNSonnblick，奥地利47.05 12.96 3109 BSRNaa测量站是ARAD/TAWES站，但数据是通过Driemel等人获得的。[33 ]第33段。奥地利格拉茨和克拉根茨两座城市的半自动天气捕捉系统TAWES [10]这些数据集涵盖了两个地点的不同时期，即格拉茨的八年测量和克拉根茨的三年测量。在两个地点测得的辐照度和天气量是相同的。因此，根据BSRN标准[11]，从定期校准和维护良好的站点收集辐射测量值，并进行多个质量控制步骤，包括Long和Shi [61]中描述的步骤太阳辐射量包括太阳辐射量、太阳辐射量和太阳辐射量，所有这些都是以1 Hz的频率测量的，并以1分钟的间隔进行平均��通过等式（1）中给出的关系式，（1b）。辅助天气数据以10分钟为一步给出，��和均为最后一分钟的平均值。此外，日照时数（U）指定了日照时间的持续时间��，日照时间大于120 W m−2（单位：秒/10分钟）。选择10分钟的最长采样间隔作为本工作剩余部分的常用采样间隔。将不合格数据重新采样为10 min数据的过程在以下小节中描述为了进一步评估模型的可移植性，从Driemel等人[33]获得了额外的数据。这些额外的数据包括四个地点Cabauw（荷兰），Lindenberg（德国），Payerne（瑞士）和Sonnblick（奥地利）。 BSRN数据包括多个数据包，每隔1分钟进行一次快速、快速和快速��日照时间没有记录，因此U通过计算每10分钟间隔内的分钟数来近似��计算，然而，丢失的测量设备，例如U，并不总是那么容易补偿。因此，在模型中包含更多的测量量限制了其对直接获取这些所需量或使用替代方法补充这些量的现场的适用性观察，e。例如，在一个实施例中，如Furlan等人[17]中的云量和云类型的目视观测相比之下，使用总辐射作为唯一预测变量的模型总是需要全局辐射加上直接或漫射辐照度测量值[18，20，22]。然而，模型可以总是通过附加的非测量数据（诸如A）来扩展��[16]《礼记》云：“君子之道，焉可诬也？预处理ZAMG和BSRN数据的预处理分三个阶段进行，首先过滤1 min数据，然后重新采样至10 min间隔，最后过滤所得10 min数据。这里提出的过滤条件受到Gueymard和Ruiz-Arias [24]的启发，并进行了迭代调整。第一过滤条件是<85°，（2a）无功功率> 0 W m−2，（2b）��,ℎ≥0 W m−2,(2c)��≥0 W m−2,and(2d)��≤1.5。（2e）条件（2a）拒绝在非常低的太阳高度测量的数据，根据Gueymard和Ruiz-Arias [24]，辐照度值较低，因此测量精度较低，同时对太阳能应用的重要性较低。条件（2b）、（2c）和（2d）确保正或非负辐照度值。必须在重新计数之前删除负值，否则在10分钟间隔内聚合时，错误的负值可能会抵消正值。然而，低至−2 W m−2的小负辐照度值在BSRN[61]定义的最小可接受值的二级测试限值内，并且可以设置为零作为去除它们的替代方案。Haeffelin等人[63]更详细地讨论了轻微负辐照度值的发生。条件（2 e）排除了平均值高于1.5的样本，因为这些样本在Graz、Klagen-Schmidt、Cabauw、Lindenberg和Payerne的数据集中被确定为离群值[13]。然而，在Sonnblick，云增强系数达到了2.5 [24]，尽管如此强烈的云增强效应是非常罕见的。因此，同样对于Sonnblick数据，来自Eq.（2）应用。在下一步中，所有符合标准（2a）- 清洁后包含少于5个数据点的所有10 min间隔均视为缺失值。格拉茨和克拉根斯堡的TAWES天气数据已经以10分钟的速率采样，因此不需要重新采样。它们的值表示10分钟间隔内最近一分钟的平均值。BSRN天气数据报告为1分钟数据。以每10分钟间隔内的最新值作为10分钟值来执行BSRN数据的重新采样，使得数据采样与TAWES数据一致。高质量的测量结果只会导致少量的缺失值，因此不会对平均辐照度数据和天气数据进行缺失值插补。因此，如果特定时间点的一个或多个重采样10 min数据缺失，则从数据集中删除整个样本在该迭代过程的第三步即最后一步中，通过闭合公式再次过滤经清理的重新采样的数据，��,ℎ+��−��<5%,(3)��确保所测量的全局水平辐照度与所测量的直接水平辐照度和漫射辐照度之和之间的偏差低于基于全局水平辐照度的5%。执行该清洁步骤以去除主要由两个原因引起的不准确测量：首先，由于架构，脏的测量设备对于全局辐照度尤其成问题的测量设备。其次，低太阳高度是一个问题，特别是对于可靠地测量全局和漫射辐照度。如果闭合公式（3）中的相对偏差大于5%，则得出结论：至少一个装置的测量不准确。最后，具有非常低的直接分数的数据点��，但高值的U是可疑的。因此，在10分钟间隔内日照时间超过500 s但日照时间超过500 s，日照时间��此外，由于非常低的辐照度值对太阳能应用的重要性很小，因此在训练和评估中只考虑了辐射强度≥10 W m−2��表2概述了数据准备流程。变量和特征工程在这项工作中的所有模型使用的直接水平分数��，作为他们的目标变量，��指示的直接水平分数的估计。输入变量为实测气温、相对湿度、气压和日照时数，��E. Schlager等人能源与人工智能12（2023）1002266=0��=1你好，∑∑∏过程中，风的信息也被丢弃在早期的模式1 + exp（−∑��)∑表2ARAD TAWES数据和BSRN数据的数据准备步骤步骤ARAD TAWES BSRN1.��–2.按条件过滤1分钟数据（2）3.通过平均将辐照度数据恢复到10分钟速率4.��-5.按闭包公式过滤（3）6.Filter by condition如果U > 500，则��U7.第一次会议。Filter by condition过滤条件>= 10逻辑和线性逻辑模型函数Ridley等人。[16]引入了逻辑模型和线性模型的混合，其中基于清晰度指数的纯逻辑模型�� 由线性形式的四个附加预测因子补充。由于这些线性分量可能会导致直接分数估计离开区间[0，1]，Ridley等人。[16]放弃了这种方法，而是将所有预测因子包括在逻辑函数中。这项工作还包括由Ridley等人导出的纯逻辑函数。[16]，并开发了线性和逻辑函数的几种组合。纯逻辑函数在本工作的剩余部分中被称为logic，并被给出为n=1。（）计算了视太阳时A和天顶角，并由此导出了晴空指数α、日平均晴空指数α��你好，1+exp（−∑��)坚持，坚持，坚持。量Δ θ和Δθ是作为测量Δθ的变化而导出的，如Ridley etal.[16 ]第10段。TAWES测量系统包括相当广泛的各种测量数据。然而，在建模中不使用每10分钟间隔混合线性-逻辑方法LOGLIN是基于逻辑函数的预测，加上其余的线性形式的预测，��其中，Σ��，Σ=��0+1+Σ��。（LOGLIN��）=1��=这是因为纳入风力信息没有带来任何好处。变量的多项式项可能没有直接的物理意义，但可能有助于涵盖数据中的非线性关系。这些人为设计的变量将在下一小节中介绍，因为它们与目标因此，选择1、2或3，其中1=1，2= U，2 = U，��3=��称为MIXED的最终混合模型由包含所有预测变量的逻辑模型定义，并将预测变量的混合二次项线性添加为��功能协调发展的3.2. 方法=11 + exp（−（0 +∑��） ��的情况）你好啊，你��好啊。��（混合）=��1使用线性和逻辑函数的几个模型使用直接分数上的最小二乘进行训练，即。例如，最大限度地减少平均平方偏差（MSD）之间的�� ，和。从模型该模型的发展是由Furlan等人的工作的动机。[17] Ridley etal.[16 ]第10段。多项式模型函数相关文献中的几个模型使用分段多项式函数[15，17，19，35]。Boland等人[47]描述了固定子区间的使用引入了一些问题，例如仅限于一个或两个预测变量、子区间的选择取决于作者、以及在子区间的边界处出现不连续性。因此，这项工作避免了分成子区间，而是基于阶数为1，使用loglin，LOGLIN，loglin= 1，2，3，和MIXED，五个混合或完全逻辑模型的方法进行检查。��后处理分段线性模型被设计限制为区间[0，1]内的��最小值[18，19，48]，逻辑模型也被自动限制为范围[0，1] [16]。��上面给出的多项式和线性逻辑模型函数可以产生小于0和大于1的结果。这些不合理的值在训练过程中被接受，但在后处理过程中被分别限制为0和1。基于直接水平分数的这种调整后的估计，直接水平辐照度以及因此直接法向和漫射辐照度可以使用等式1中所述的关系来计算。（一）.3.3. 培训评价战略你好��，.，��所有方法的训练，我。例如，林毅夫，RID，PCA，��=��1+��1��=1�� .（林）��在ARAD TAWES数据集上进行LOGLIN和MIXED，��格拉茨和克拉根斯堡这两个地方加起来这些数据包括在这些模型在本工作的剩余部分中被命名为LIN_REQ，n= 1，由于多项式模型的变量之间的多重共线性随着阶数的增加而增加��，因此包括了Lin��=�� 3，4，5的两个正则化版本。两种正则化方法是岭正则化[64]和主成分分析（PCA）[65]。岭正则化最小化MSD加上系数的L2范数，��...，...��从这里开始，RID正则化（其中R2= 3，4，5）使用岭正则化来识别三个模型。PCA是第二种正则化方法。它减少了预测因子的数量，以减轻多重共线性的问题。在这项工作中，PCA被限制为尽可能多的组件，以解释至少98%的数据方差目标函数与Eq相同（LIN），但其中LIN是主成分，而不是具有物理意义的变量��使用PCA的多项式模型方法由PCA表示，其中PCA= 3，4，5。��因此，总共有11个线性模型使用交叉验证进行训练和评估，其中5个是没有正则化的线性模型，3个模型使用岭正则化，3个使用PCA。总共243302个样本，分为80%的训练集和20%的测试集。拆分遵循日历日，即。例如，将各个天的数据分配给训练集或作为整体的测试集。然后在5重交叉验证方案中训练模型。在每个折叠中，80%的训练数据用于训练，20%的训练数据用于训练。数据被用作开发集以评估模型在各个褶皱上的性能。在每次迭代中，预测变量被缩放到零均值和单位方差，使得所有输入具有相同的数量级。训练在约156 000个样本/折叠上进行，并且训练时间取决于预测器的数量和模型复杂度。所有测试都是在一个系统上进行的，该系统具有4核CPU，基本频率为1.80 GHz，16 GB RAM和512 GB SSD。最简单的模型LIN1的训练时间不到一秒，九个预测值加上拦截值MIXED方法需要最长的平均训练时间，每次迭代约117 s，因为它是一种非线性方法，具有45个预测因子加上截距。在模型选择中不考虑大容量存储空间，因为缩放E. Schlager等人能源与人工智能12（2023）1002267||||表3季节的开始和结束围绕着各自的至点和分点。活动期间11月6日2月5日冬至2月6日5月5日春分5月6日8月5日夏至8月6日11月5日秋分和PCA Transformer保存在pickle文件中，最佳参数保存在CSV文件中，所有这些文件的大小只有几个字节。评估是基于几个措施比较真实和表4在交叉验证的所有五个折叠中，相对于的RMSD、MBD、rRMSD、rMBD、R2和maxAD的绝对值的平均值��。RMSD MBD rRMSD rMBD R2 maxAD沪ICP备05000000号沪ICP备16006666号-1沪ICP备16006666号-1沪ICP备15004856号-1LIN5 64.89 0.61 18.91 0.18 0.96 798.13RID3 69.69 1.06 20.30 0.31 0.96 594.72RID4 67.20 0.56 19.58 0.17 0.96 676.60RID5 66.01 0.58 19.23 0.17 0.96主成分分析3 83.39 0.84 24.30 0.25 0.94 719.83估计的直接法向辐照度和垂直辐照度。系数你好，你好，��方案协调会4 84.30 1.15 24.56 0.34 0.94 748.19测定值（R2）和均方根误差（RMSD）都很好回归问题的已知度量。性能评估由最大绝对偏差（maxAD）和平均偏差（MBD）补充，作为模型低估或高估直接正常辐照度的指标[59]。还列出了相对测量值rRMSD和rMBD，因为Gueymard [57]声称百分比值更容易理解，Gueymard和Ruiz-Arias [24]引入了rMBD 10%和rRMSD 30%的评价标准，表明模型误差较低。基于这五项措施，并包括模型的复杂性，两个模型的RID 3和混合被选中进行更详细的评估。进一步评价的一个方面是季节性的影响。为了更深入地研究这一点，在第一次评估中表现最好的两种模型方法，即RID 3和MIXED，在ARAD TAWES数据集的完整训练集上进行了重新训练。例如，对格拉茨和克拉根斯堡数据集的80%。测试集被分成四个区间，其中包括给定的至点和分点。表3所最后，分别对模型的性能进行了评价四个季节的数据最后评价审查了格拉茨和克拉根斯堡两市之间模型的短途可转移性。因此，RID3和MIXED分别在每个地点的ARAD TAWES数据上再次进行训练，从而为格拉茨和克拉根茨建立了不同的模型。然后，在每个位置的测试数据上对这些模型进行评估，比较每个模型在其训练的位置方面的性能对于，以及关于对立的位置。此外，模型在两个位置的数据上进行了训练，并分别在每一侧进行了测试。为了进一步评价模型的可转移性和普遍性，使用了来自BSRN数据集的其他位置的数据。为此，RID3和MIXED分别在每个位置上重新训练，以获得类似于格拉茨和克拉根茨的特定位置模型。此外，模型方法在属于温带的所有位置的数据上一起训练，I.例如，格拉茨、克拉根茨、卡鲍夫、林登贝格和帕耶恩，温和的模特然而，Gueymard和Ruiz-Arias [24]以及Abreu等人[22]中的温带模型在温带地区的更多位置进行了训练，包括美洲和亚洲的地区，并且被认为是更通用的模型。用于培训和评估的数据仅限于每个地点的2017年和2018年。训练模型的名称由相应的模型方法（RID 3或MIXED）加上位置组成，其中PCA5 83.59 1.03 24.35 0.30 0.94 772.84电话：+86-021 - 8888888传真：+86-021 - 8888888LOGLIN1 97.12 3.64 28.30 1.07 0.92 938.51LOGLIN2 89.34 2.21 26.03 0.64 0.93 750.30LOGLIN3 83.62 1.47 24.36 0.42 0.94 670.48混合76.77 1.28 22.35 0.37 0.95 668.00表4中列出了每种型号五次折叠的偏差测量绝对值的平均值。对于线性方法，随着多项式阶数增加到四阶，RMSD显著改善，但对于五阶仅略有改善，而maxAD随着多项式阶数增加而增加。此外，R2对于阶数1、2和3改善，但随后对于增加阶数没有进一步改善。包括岭正则化的线性方法导致略微更差的RMSD，而使用PCA的线性方法总体上产生更差的结果。纯逻辑方法的RMSD比LIN2差，MBD略好，但比逻辑线性方法表现更好。混合方法导致类似于LIN2的RMSD，但最大AD更差。RID 3模型在具有类似的低RMSD的模型中具有最低的maxAD，同时具有最高的R2，因此被视为最佳多项式模型。从在目标函数中使用逻辑项的模型来看，混合方法表现最好。图图2描绘了针对最佳执行方法RID 3、最佳执行逻辑方法MIXED、��以及方法RISK和LOGLIN3，因为它们存在于文献[16]中。RID 3显示了接近相等线的大多数点，只有一些单个离群值。MIXED、EQUIPMENT和LOGLIN 3显示出低估直接法向辐照度的趋势，其中EQUIPMENT、EQUIPMENT的值增加，由于略低于等值线的点的密度更大，并由绿色/黄色表示，因此可以识

下载后可阅读完整内容，剩余1页未读，立即下载