没有合适的资源?快使用搜索试试~ 我知道了~
574NNT : 2022IPPAT018AMAURY DURAND0功能时间序列建模及其在多地点电力负荷曲线表示和分析中的应用0巴黎理工学院博士学位论文,由Telecom Paris准备0第574号数学哈达玛德博士学院(EDMH)0本论文于2022年4月14日在Palaiseau提交和答辩,作者为0评审委员会成员:0Philippe Soulier 教授,巴黎纳特尔大学 主席,考官0Shahin Tavakoli 高级讲师,日内瓦经济与管理学院 评阅人0Karim Abed-Meraim 教授,奥尔良大学 评阅人0Anne Sabourin 副教授,T´el´ecom Paris 考官0Franc¸ois Roueff 教授,T´el´ecom Paris 导师0Jean-Marc Jicquel 工程师研究员,EDF R&D (TREE) 客座0Nicolas Paul 工程师研究员,EDF R&D (PRISME) 客座iii0摘要0智能电表收集的电力负荷曲线的分析是许多能源管理任务的关键步骤,包括消费预测和负荷监测,以及客户特征和分割。在这个背景下,EDFR&D的研究人员对从每日电力负荷曲线中提取重要信息以比较不同建筑物的消费行为感兴趣。我博士期间所在的研究小组的策略是使用基于物理和确定性模型的信息,如房间大小、绝缘材料或天气数据,或者根据专家知识从电力负荷曲线中提取手动设计的模式。鉴于收集到的数据量不断增加,该小组对统计或数据驱动方法的兴趣近年来显著增加。这些方法应该能够在不依赖昂贵的处理和专家知识的情况下利用大规模数据提供新的解决方案。我的工作直接符合这一趋势,提出了两种建模方法:第一种方法基于功能时间序列,第二种方法基于非负张量分解。本论文分为三个主要部分。在第一部分中,我们介绍了工业背景和论文的实际目标,以及对数据的探索性分析和对提出的两种建模方法的讨论。在第二部分中,我们遵循第一种建模方法,并对功能时间序列的谱理论进行了深入研究。最后,在第三部分中介绍了基于非负张量分解的第二种建模方法。1.3.2From discrete data to functional data . . . . . . . . . . .90目录0i 数据的背景和探索性分析 101 上下文和背景 301 . 1 上下文 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 . 2 时间序列的表示和比较 . . . . . . . . . . . . . . . . . . . . . 501 . 2 . 1 基于属性的比较 . . . . . . . . . . . . . . . . . 501 . 2 . 2 端到端方法 . . . . . . . . . . . . . . . . . . . . . 601 . 2 . 3 基于模式的比较 . . . . . . . . . . . . . . . . . . 601 . 3 功能时间序列框架 . . . . . . . . . . . . . . . 701 . 3 . 1 功能与希尔伯特设置 . . . . . . . . . . . . . . 801 . 3 . 3 功能数据的注册 . . . . . . . . . . . . . . . 1101.3.4功能主成分分析1201.3.5功能时间序列1401.3.6谐波fPCA1601.3.7功能数据的统计推断1701.4在Web平台ACDC中的负荷曲线分析2001.4.1数据可视化2001.4.2负荷曲线的分解2401.4.3多站点分析2701.4.4与室外温度的相关性3101背景和预备知识3301.1背景3301.2时间序列的表示和比较35 1.2.1特征比较3601.2.2端到端方法3601.2.3模式比较3701.3功能时间序列的框架3801.3.1功能框架与希尔伯特框架3901.3.2从离散数据到功能数据4001.3.3功能数据对齐4201.3.4功能主成分分析4301.3.5功能时间序列4501.3.6谐波ACPf470v0vi目录01.3.7功能数据的统计推断4801.4在Web平台ACDC上的负荷曲线分析4901.4.1数据可视化4901.4.2负荷曲线的分解5001.4.3分析多站点5101.4.4与室外温度的相关性5202数据的探索性分析5302.1数据集和预处理的介绍5302.2采用的两种方法5902.3对日均值的一阶分析6102.4无温度居中64 2.4.1 fPCA结果6502.4.2谐波fPCA的结果6702.5温度居中7202.6讨论和结论7403论文贡献和展望7703.1论文摘要78 3.1.1第二部分:功能时间序列的理论方面7803.1.2第三部分:多站点电力负荷分解和聚类。8003.2其他功能多站点模型的展望810ii功能时间序列的理论方面850第四章一般的斯通和博赫纳定理9304 . 1向量值和正算子值测度。9404 . 1 . 1值域为Banach空间的测度。9404 . 1 . 2正算子值测度(p.o.v.m.)。9504 . 2局部紧阿贝尔群和斯通和博赫纳定理。97 4 . 2 . 1基本定义和结果。9804 . 2 . 2Stone和Bochner定理。9904 . 3正常希尔伯特模。10104 . 4 Stone和Bochner定理的推广。10504 . 5迹类p.o.v.m.。111 4 . 5 . 1迹类p.o.v.m.的Radon-Nikodym性质。11204 . 5 . 2迹类p.o.v.m.的一般Bochner定理。11504 . 5 . 3迹类p.o.v.m.的特征分解。1160目录第七章05弱平稳随机过程的谱理论,值域为可分希尔伯特空间。12105 . 1与随机可数可加格拉米安-正交散射测度的积分。121 5 . 1 .1可数可加格拉米安-正交散射测度。12105 . 1 . 2空间L 2 (Λ,A,O(H 0,G 0),ν)。12405 . 1 . 3关于随机c.a.g.o.s.测度的积分。12905 . 2格拉米安-克拉默表示。13105 . 3推迟的证明。136 5 . 3 . 1 5 . 1的证明。13605 . 3 . 2 5 . 2的证明。14205 . 4与最近的方法比较。145 5 . 4 . 1等距与格拉米安-等距。14505 . 4 . 2功能正交增量过程与c.a.g.o.s.测度的比较。14506线性滤波和长记忆过程的应用。14906 . 1线性滤波的组合和反演。149 6 . 1 . 1随机c.a.g.o.s.测度的线性滤波。14906 . 1 . 2弱平稳随机过程的情况。15206 . 2克拉默-卡尔胡宁-洛夫分解。15306 . 3 关于函数随机变量的一些细节。158 6 . 3 . 1希尔伯特-施密特积分算子。15806 . 3 . 2L 2 (V,V,ξ)值弱平稳时间序列。16006 . 4 希尔伯特值FIARMA过程。161 6 . 4 . 1 ARMA过程。16206 . 4 . 2弱平稳过程的分数算子积分。16506 . 4 . 3其他长记忆过程。16806推迟的证明。170 6 . 5 . 1 6 . 1的证明。17006 . 5 . 2 6 . 3 . 1的证明。17206.5.3 第6.3.2节的证明17406.5.4 第6.4.1节的证明17706.5.5 第6.4.2节的证明17806.5.6 第6.4.3节的证明1820目录viii0iii多站点电力负荷分解和聚类18707平滑的非负张量分解用于多站点电力负荷监测19307.1 提出的模型193 7.1.1 优化问题19507.1.2 作为加权NTF问题的公式化19607.1.3 HALS算法19807.2 实验结果201 7.2.1 EERE数据的结果20207.2.2 EDF数据的结果20507.3 结论20608平滑约束的非负张量分解与缺失值20908.1 加权NTF的全局最优解存在21108.2 用于约束加权NTF的HALS算法215 8.2.1 C n = +∞的情况21708.2.2 C n < +∞的情况21708.3 实验结果22008.4 讨论和展望22208.5 推迟的证明224 8.5.1 命题8.1.1和8.4.1的证明22408.5.2 C p,q (ρ,I W)的定义和命题8.1.2的证明22608.6 C p,q (ρ,I W)的逼近22908.6.1 计算C p,q (ρ,I')的算法23008.6.2 特殊情况下一个维度不受限制23108.7 关于TV范数最优解的一些结果2340附录iv 2390算子背景理论2410a.1 算子的基本定义和结果241 a.1.1 Hilbert空间上算子的一般定义2420a.1.2 可分离情况2440a.1.3 等距和酉算子2440a.1.4 广义逆2450a.1.5 正规算子的奇异值分解2450a.2 强和弱算子拓扑246d.1.3Practical implementation details . . . . . . . . . . . . . . 255bibliography2650目录ix0b Banach空间中的可测性和积分2470b.1 Banach空间中的可测性2470b.2 Bochner积分2490c张量代数2510d算法细节2530d.1每日均值分析的详细信息 . . . . . . . . . . . . . . . . 2530d.1.1更新主要聚类的详细信息 . . . . . . . . . . . . 2530d.1.2更新回归的详细信息 . . . . . . . . . . . . . . . 2540用于负载曲线分析的图形用户界面 259Figure 1.1Raw data. Load (in blue) is in kW and Temperature(in red) is in ◦C. . . . . . . . . . . . . . . . . . . . . . . . 21Figure 1.3Weekly heatmap of load data. At the center, heatmapsof electrical load (in kW) where rows represent weeksand columns represent intraday time and week days.At the left, daily temperatures, at the right, load foreach week at the selected week day and intraday time.At the bottom, weekly load curve for the selectedweek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23Figure 1.5Effect of seasonal variation. . . . . . . . . . . . . . . . 26Figure 1.7Histograms for each features. . . . . . . . . . . . . . . 30Figure 2.1Weekly heatmaps of power and temperature for onesite. Missing data are in gray and values close to 0 (inblue) indicate the use of an external power generator. . 55Figure 2.3Imputation of missing values . . . . . . . . . . . . . . . 57Figure 2.5Daily mean data. . . . . . . . . . . . . . . . . . . . . . 60x0图表目录0图1.2负载数据的每日热图。中心是电力负载(以千瓦为单位),行代表天,列代表一天内的时间。左边是每日温度,右边是所选时间的每天负载。底部是所选日期的每日负载曲线。. . . . . . . . . . . . . . . . . 220图1.4负载曲线的分解,包括最小曲线和季节变化。. . . . . . . . . . . . . . . 250图1.6负载曲线分解的饼图。. . . . . 280图1.8星期一(蓝色)和星期六(棕色)的功率与温度关系。橙色和绿色分别表示星期一的线性和二次回归。紫色和灰色分别表示星期六的线性和二次回归。. . . . 310图2.2发电机检测方法示例。. . . . . 560图2.4平滑每日负载曲线,闭市日和开市日。. . . . . . . . . . . . . . . . . . . . . . . 58List of FiguresxiFigure 2.7Illustration of the first centering approach. . . . . . . 64Figure 2.9fPCA loadings as perturbation of the mean. The blackdashed curve is the mean ˆµw, the other lines representˆµw + Cφk for C in the range of scores. Blue and redcorrespond to C < 0 and C > 0 respectively.. . . . . . 66Figure 2.10Truncated Karhunen-Loeve expansion . . . . . . . . . . 67Figure 2.11Importance of the number of lags in the reconstruc-tion.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69Figure 2.12Harmonic fPCA loadings filters coefficients and scores.Each row corresponds to one functional principal com-ponent. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70Figure 2.13Harmonic fPCA loading filters as perturbations of themean for opening days. The dashed black line in themean curve ˆµ1 and the solid blue line is the perturba-tion ˆµ1 + C(δ−1ϕ1,−1 + δ0ϕ1,0 + δ1ϕ1,1).. . . . . . . . . 70Figure 2.14Truncated Cram´er-Karhunen-Loeve expansion . . . . . 71Figure 2.15Comparison of Karhunen-Loeve and Cram´er-Karhunen-Lo`eve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71Figure 2.16Nadaraya-Watson estimate of ˆµw(u; τ). Colors repre-sent values of temperature τ. . . . . . . . . . . . . . . . 72Figure 2.17fPCA loadings and scores. Each row corresponds toone functional principal component. . . . . . . . . . . . 73Figure 2.18Truncated Karhunen-Loeve expansion . . . . . . . . . . 74Figure 2.19Comparison of autocorrelation with the two centeringmethods. . . . . . . . . . . . . . . . . . . . . . . . . . . 750图2.6每日数据回归和聚类。左图显示了主要聚类的结果:蓝色对应于Wt =0(闭市日),橙色对应于Wt =1(开市日)。右图表示回归的结果。对于每个主要制度,绘制回归函数,并用不同颜色表示子制度。蓝色和橙色分别对应于当Wt = 0时的Zt = 0(正常)和Zt =1(极端),绿色和红色分别对应于当Wt = 1时的Zt = 0和Zt = 1。. . . . . . . . . . . . . .. . . . . . . . . . . 630图2.8 fPCA负载和得分。每一行对应一个功能主成分。. . . . . . . . . . . 65xiiList of FiguresFigure 2.20Successive plots of µ1(·; 15) + C ∑Kk=1 φk with C > 0for K = 0, · · · , 3.. . . . . . . . . . . . . . . . . . . . . . 76Figure 4.1Possible proof paths for Bochner’s, Stone’s theoremsand their generalizations.. . . . . . . . . . . . . . . . . 110Figure 7.1EERE’s Dataset : factors. . . . . . . . . . . . . . . . . . 203Figure 7.2EERE’s Dataset : site activations. . . . . . . . . . . . . 204Figure 7.3EDF’s Dataset : factors . . . . . . . . . . . . . . . . . . . 207Figure 7.4EDF’s Dataset : site activations of our model . . . . . . 208Figure E.1Daily mean analysis in GUI . . . . . . . . . . . . . . . . 261Figure E.2Visualizing functional data in GUI . . . . . . . . . . . . 262Figure E.3fPCA loadings and scores in GUI. . . . . . . . . . . . 263Figure E.4Truncated Karhunen-Lo`eve expansion in GUI. . . . . 264L I S T O F TA B L E STable 1.1Review of statistical inference for functional data. . . 19Table 1.2Values are in MWh/m2. . . . . . . . . . . . . . . . . . . 29Table 8.1Accuracy (in %) for randomly generated data, “both”refers to initializing swntf with cpwopt.. . . . . . . . 222xiiiN O TAT I O N S A N D A C R O N Y M SSetsE∗ = Lb(E, C)Continuous dual space of E.AE,AClosure of A in E. Use second notation if no ambi-guity on the space.SpanE (A), Span (A)Closure of the span of A in E. Use second notationif no ambiguity on the space.Im(P)Closure of the range of operator P.Operator spacesO(E, F)Set of operators from a subset of E to F.L(E, F)Set of linear mappings from E to F.Lb(E, F)Set of continuous (bounded) linear mappings from E to F.K(E, F)Set of compact operators from E to F.Sp(E, F)Set of Schatten-p operators from E to F.Measurability and integration(Λ, A)Measurable space.B(E)Borel σ-filed generated by the norm ∥·∥E.µ-a.e.µ-almost everywhere.F(Λ, A, E)Set of measurable functions from (Λ, A) to (E, B(E)).Fs (Λ, A, E, F)Set of simply-measurable functions from (Λ, A) toLb(E, F).FO (Λ, A, E, F)Set of O-measurable functions from (Λ, A) to O(E, F).Lp(Λ, A, E, µ)Set of measurable functions with finite p-th power normintegral.Lp(Λ, A, E, µ)Lp(Λ, A, E, µ) space quotiented by µ-a.e. equalityxivacronymsxvRandom variables(Ω, F, P)Probability space.E, PExpectation and probability measure.Cov (X, Y)Covariance operator between X and Y.Cov(X)Equivalent to Cov (X, X).Other notations and acronymsPHadjoint of the operator P.T = R/(2πZ)or any interval congruent to [0, 2π).l.c.a.Locally Compact Abelian.s.o.t.Strong Operator Topology.w.o.t.Weak Operator Topology.p.o.v.m.Positive Operator-Valued Measures.c.a.o.s.Countably Additive Orthogonally Scattered.c.a.g.o.s.Countably Additive Gramian-Orthogonally Scattered.PCAPrincipal Components Analysis.fPCAfunctional PCA.ARAutoregressive.ARMAAutoregressive Moving Average.FIARMAFractionally Integrated Autoregressive Moving Average.NMFNon-negative Matrix Factorization.NTFNon-negative Tensor Factorization.HALSHierarchical Alternating Least Squares.SVDSingular Values Decomposing.Part IB A C K G R O U N D A N D E X P L O R ATO RY A N A LY S I S O FT H E D ATAThis part provides general information about the industrial con-text of my PhD and the practical objective addressed during thesethree years. In particular, we discuss in Chapter 1 the problemof the representation and comparison of time series and pro-vide an overview of the functional time series framework. Next,we present EDF’s strategy for extracting information from thedaily load curves. In Chapter 2, we present the results of theexploratory analysis of the dataset provided by EDF. After ex-plaining the pre-processing steps, we study the results of secondorder dimension reduction methods, namely functional principalcomponent analysis and its harmonic extension. A discussionabout the drawbacks of these methods is provided and we con-clude that a non-negative structured decomposition that takesinto account the effect of temperature should overcome thesedrawbacks.1C O N T E X T A N D B A C K G R O U N D1.1ContextEDF is a leading French energy company whose activity extends to manyareas ranging from the production and distribution of electricity to services.The group has a large nuclear fleet, with 58 reactors spread throughout theterritory and owns numerous onshore and offshore wind farms, as well assolar fields and hydroelectric power plants. This makes it the leading Euro-pean producer of renewable energies.For several years, EDF has been participating in a process of transforma-tion of the energy sector in order to meet the challenges of climate changeand aims for CO2 neutrality by 2050. This vision is reflected in their Cap 2030strategic project, which is based on three pillars: innovation for customers,low carbon and international growth. In this context, EDF takes great inter-est in research and has eight R&D sites, including three in France: EDF LabParis-Saclay, EDF Lab Les Renardi`eres and EDF Lab Chatou. In the first site,researchers focus on various topics ranging from vibrational mechanics andmathematical and digital simulation to client relations. The research carriedout in the second site focuses on energy efficiency, security and reliability ofthe electrical network. Finally, the last site develops expertise in the fields ofhydraulics, renewable and nuclear energies and the environment.My PhD was hosted by two department: the TREE department (morespecifically, the E36 group) at EDF Lab les Renardi`eres and the PRISMEdepartment (more specifically, the P12 group) at EDF Lab Chatou.The PRISME (Performance, Risque Industriel et Surveillance pour la Main-tenance et l’Exploitation) department develops innovative solutions for dataacquisition and physical and mathematical modeling to improve electricityproduction. The department has two main areas of expertise. The first isthe life cycle of the means of production with physical measurements andsimulations, but also safety control. The second expertise is data processing,304 上下文和背景0特别是在能源生产的背景下,涉及信号和图像处理以及统计学习。为了开展其项目,该部门分为六个小组。P12小组(动态系统、图像和信号)与数据处理专业知识更密切相关。因此,它的能力围绕信号和图像处理、优化和动态系统展开。所进行的项目涉及各种主题,如水力学、热灵活性或生命周期。TREE(Technologie etRecherche pour l'EffacitéEnergétique)部门汇集了9个小组,致力于电力调节的各个方面,从资源优化到建筑物消耗建模。该部门为住宅、第三产业和工业部门的新旧建筑开发低CO2工具。在这种背景下,人工智能方法越来越受欢迎,应用范围从热泵和太阳能电池板的缺陷检测到智能建筑中的自动能源调节。E36小组(服务与连接系统)专门从事智能建筑的物联网(IoT)。特别是,该小组将数据收集和分析集成到EDF分支机构的生态系统中(例如Sowee、Dalkia、EDFENR),并为内部和外部合作伙伴进行了大量研究。从数据分析的角度来看,该小组开发的解决方案主要包括消费的可视化和监控,以及基于专家知识的负荷曲线分析。对于后者的任务,该小组开发了一个名为ACDC(Analyse de Courbes DeCharges)的Web平台。我的工作以两种方式补充了这些方法:我提出了对负荷曲线分析的统计和数据驱动的观点,并处理了观察到多个建筑物的消费的多站点情况。在这种工业背景下,我的工作的实际目标可以表达如下。0(PO)从多站点负荷曲线中提取信息,以帮助理解站点之间的差异,使用无监督方法,不使用专家知识,但仍然易于解释。0在更高的层次上,实际目标(PO)直接引出了对时间序列的表示和比较的问题,针对这个问题,在过去几十年的文献中提出了许多方法。在本章中,我提出了这些方法的概述,以及在ACDC Web平台上实施的方法。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功