机器学习预测与优化热传输特性

186 浏览量更新于2024-01-22 收藏 1.73MB PDF 举报

机器学习预测

优化算法

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

能源与人工智能8（2022）100153透视透视：用机器学习方法预测和优化热传输特性韩伟a，花宝a，*，阮秀林b，*a美国密歇根大学-上海交通大学联合研究所，上海交通大学，上海200240，中国b普渡大学机械工程学院和Birck纳米技术中心，West Lafayette，IN 47907，美国H I G H L I G H T S G R A P H I C A LA B标准• 机器学习预测方法可以作为替代模型，并且比基于物理的预测方法用于预测热传输特性的分析模型。• 机器学习优化算法可以作为搜索工具，与基于直觉的随机搜索或调整相比，具有更高的有效性• 优秀挑战和机会指出了未来的发展方向，包括开发适合于小数据集的机器学习方法，发现有效的基于物理的描述符，从实验中生成数据集并用实验验证机器学习结果，以及通过发现新的物理来取得突破。A R T I C L EI N FO保留字：热传输特性机器学习预测优化A B标准近年来，（大）数据科学已成为物理科学研究的“第数据驱动技术，例如机器学习，在处理高维特征和量之间的复杂映射问题方面是有利的，否则这些问题对于其他科学范式来说是非常困难或巨大成本的。在过去五年左右的时间里，机器学习辅助的热传输研究快速增长。从这个角度来看，我们回顾了机器学习和热输运之间的交叉的最新进展，其中机器学习方法通常作为预测热输运性质的替代模型，或者作为设计所需热性质的结构和探索热输运机制的工具。我们提供了关于机器学习方法与基于物理的方法相比在研究热传输特性方面的优势的观点。我们还讨论了如何提高预测分析的准确性和结构优化的效率，为更好地利用基于机器学习的方法来推进热传输研究提供指导。最后，我们确定了这一活跃领域的几个突出挑战以及未来发展的机会，* 通讯作者。电子邮件地址：hua.bao@ sjtu.edu.cn（H.Bao），ruan@purdue.edu（X. Ruan）。https://doi.org/10.1016/j.egyai.2022.1001532022年3月12日在线提供2666-5468/© 2022作者。由爱思唯尔有限公司出版。这是一篇开放获取的文章，获得了CC BY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表能源与AI期刊主页：www.sciencedirect.com/journal/energy-and-aiH. Wei等人能源与人工智能8（2022）1001532包括开发适用于小数据集的机器学习方法，发现有效的基于物理的描述符，从实验中生成数据集并通过实验验证机器学习结果，以及通过发现新的物理学来实现突破1. 介绍热传输在各种应用中起着重要作用，包括电子产品中的热管理，废热收集和热绝缘[1 - 4]。了解和定制的热传输性能是这些应用的重要。然而，这是一项具有挑战性的任务，主要有两个原因。首先，控制热传输的物理定律在不同的材料类型和不同的尺度上是完全不同的[5，6]。其次，从原子尺度到宏观尺度，材料的详细结构对热输运性质具有显著影响，因此使结构-性质关系变得非常复杂[7 - 9]。在过去的几十年里，在这个动态研究领域取得了重大进展，主要是由基于物理学的方法驱动[5，6，10，11]。例如，已经开发了先进的模拟方法和计算工具，包括第一性原理密度泛函理论（DFT）计算[4，11，12]、分子动力学（MD）模拟[13- 15]、原子格林函数（AGF）[16 - 19]、声子玻尔兹曼输运方程（BTE）[20 - 23]和热扩散方程[24- 26]。还开发了各种实验热表征方法[3，27，28]，如激光闪光法[29- [38 的瞬态热反射技术在时域[41，42]和频域[42，43]分析中。最近，（大）数据科学开始引起物理科学领域的关注，并成为“科学研究的第数据驱动的方案绕过了物理学，因此对特定的物理问题和数据来源没有特别的偏好[44]。因此，它可以补充前三个段落，Digms，即，理论、实验和模拟[44]。此外，它非常适合解决高维特征和量之间的复杂映射问题，这对于其他范式来说是非常困难或巨大的成本[44]。由于这一优势，数据驱动技术，例如机器学习方法，已被应用于材料科学，并加快了材料的理解，选择和设计[45 - 49]。对于热科学界来说，随着计算和实验方法的发展，大量的数据逐渐积累，也可以方便地应用数据驱动的方法来辅助热输运性质的研究。在过去五年左右的时间里，热科学领域的机器学习辅助研究爆发了。例如，机器学习方法可以作为预测热传输特性的替代模型[50 - 52]，或者作为设计所需热特性结构和探索热传输机制的工具[53 - 56]。在这方面，我们提请注意最近在以下方面取得的进展：机器学习辅助热传输特性研究。我们注意到，在这一领域已经有一些现有的综述论文，侧重于热科学领域机器学习应用的不同方面。例如，Ju等人使用基于机器学习的方法调查了具有高/低热导率/电导率的材料的探索和纳米结构设计的研究[57]。Wan等人介绍了最新的机器学习应用程序，用于热传输中的属性预测和材料发现[58]。Zhang等人回顾了使用机器学习筛选热导率和界面热导率[59]。在此，我们就机器学习方法相对于基于物理的方法的优势，以及如何提高预测模型的准确性和结构优化的效率，以更好地利用机器学习方法提供了我们的观点。基于学习的方法来推进热传输研究。我们只阐述了一些说明性的例子，而不是涵盖整个范围。本文件其余部分的结构如下。在第2节中，我们首先介绍了机器学习的原理，用于预测和优化热传输特性。在第3节中，我们将分别讨论预测分析和结构优化的关键应用。在第4节中，我们评论在这个新兴的跨学科研究领域的挑战和机遇。2. 机器学习预测被定义为在输出和输入之间建立预测模型，通常涉及三个步骤[53，60 - 63 ]。第一步是获取数据集，该数据集由感兴趣的目标属性组成。数据集可以从实验、数值模拟、公开数据中获得。还有现有的材料数据库[64]，如材料项目[65]，AFLOW[66]，无机晶体结构数据库[67]，开放量子材料数据库[68]和聚合物数据库[69]。在这些数据库中，收集了各种材料特性，例如形成焓、带隙和模量。然而，热输运性质的数据是有限的。第二步是识别一组描述目标系统的特性的量，这些特性与感兴趣的属性强相关。这些量通常被称为描述符[70]。选择的描述符最好满足几个要求[45，70]：（a）唯一性：所有系统都应该有一个确切的表示;（b）描述性：非常不同（相似）的系统应该是特征性的。其特征在于非常不同的（类似的）描述符值;（c）完整：第三步是应用机器学习方法来发现描述符和目标属性之间的潜在关系通常采用两种类型的机器学习方法[71]。一种是传统的机器学习方法，需要根据对问题的理解和专业知识手动选择描述符[71]。另一种是深度学习方法，可以自动提取系统的特征，并从原始数据中分析信息。这种类型的方法对于学习输入是结构图像或矩阵的问题是有利的[71]。传统的机器学习和深度学习都有两类学习方法，即监督学习和无监督学习[72]。监督学习方法用于解决回归和分类问题，而非监督学习方法用于确定关联和聚类问题[72，73]。热输运研究中的预测问题大多是回归问题，目标热输运性质是连续的。因此，通常使用监督回归方法。典型的传统机器学习方法包括线性回归[62，74]，支持向量回归[51，61]，高斯过程回归[52，61，75，76]，随机森林回归[62，74，77，78]，核岭回归[51]，极端梯度提升[51]，人工神经网络[53，60，62，77]。流行的深度学习方法包括卷积神经网络[75，79]和生成对抗网络[80，81]。预测过程的示意图在图la中示出。通常，数据集分为训练集、验证集和测试集[82]。该模型最初在训练集上学习，并通过检查验证集进一步调整为了简化，训练集和验证集被共同地H. Wei等人能源与人工智能8（2022）1001533在图1a中称为训练数据。在训练过程中看不见的测试集是为了测试训练模型的预测精度。预测误差可以通过一些度量来评估，例如平均值绝对误差、均方根误差和决定系数（R2）[58]。优化是指在指定的标准下从一组可用的备选方案中选择所需的元素[83]。优化中有四个基本要素：目标函数，描述符，目标函数的求值器和优化算法[64，84]。首先，优化问题需要在一定的约束条件下明确定义特定的目标函数[84]。通常，目标函数是最小化或最大化目标属性[58]。然后，应确定适合描述设计系统的描述符。例如，在结构优化中，结构的数字表示大多被采用为描述符，这些描述符通常被编码为N位数组，其中每个位表示自由度的值[56，85]。然后，用一定的优化算法进行优化过程，以找出最优解。在优化过程中，通常通过相应的基于物理的方法来评估所选择的候选者的属性以制定目标函数。对于结构优化，结构的自由度通常很大，迭代优化方法比直接方法更有用[83]。此外，随机性通常存在于迭代搜索过程中，因此随机优化算法更可取[83]，如模拟退火[86]，粒子群优化[87]，进化算法[88]，遗传算法[89]，贝叶斯优化，mization[90]，Monte Carlo树搜索[91]图1.b显示了迭代优化过程的首先，通过从设计空间中随机选择产生初始对目标属性进行评估，并获得目标函数的值。然后应用优化算法来识别可能满足优化期望的新一代。该步骤将迭代地执行，直到找到最佳元素或满足某个标准，例如，每一代的最佳个体在几代中不发生变化。使用优化算法，可以有效地搜索所需的属性，而不是繁琐的尝试和错误。3. 最新进展接下来，我们从预测和优化两个方面介绍了应用机器学习方法研究热输运性质的最新进展。3.1. 预测分析在本节中，我们首先介绍了机器学习在预测热性能方面的最新进展。特别是，我们展示了机器学习在构建代理方面与基于物理的分析模型相比。然后，我们讨论了机器学习模型预测精度的决定因素。然后介绍了机器学习代理模型的两个应用--高通量筛选和机器学习潜力。3.1.1. 预测作为替代模型机器学习方法提取热传输特性和材料特性之间的关系，例如元素信息，结构特征或其他材料特性[57，58，82]。经过适当训练的机器学习模型应该具有与用于生成数据的方法相当的预测准确性。例如，如果训练数据来自数值模拟，则机器学习预测应该与相应的数值结果一样准确。此外，机器学习预测模型可以被视为半分析模型，这比数值模拟（求解基于物理的方程）和实验更有利，因为它们可以提供快速预测[75]。与现有的基于物理的分析模型相比，经过适当训练的机器学习模型应该实现更高的预测精度。换句话说，如果开发了一个机器学习模型，就有必要证明这个模型比现有的基于物理的分析模型具有更好的准确性，正如文献[50，61，75，92]中所做的那样最近有相当多的作品使用机器学习预测热导率的方法，包括晶格热导率和有效热导率。例如，Juneja等人基于从Materials Project[66]收集的120条数据的数据集建立了一个高斯过程回归模型来预测化合物的晶格热导率，其中晶格热导率是通过第一原理DFT计算获得的[50]图2.a和图2b分别显示了DFT计算与基于物理的Slack模型和基于机器学习的高斯过程回归模型的预测之间的比较。Slack模型严重高估了所有的化合物，而预测的晶格热导率的高斯过程回归同意非常好的第一性原理计算值。高斯过程回归模型在准确性方面优于基于物理的Slack模型1个数量级[50]。Zhu等人应用核岭回归、人工神经网络和卷积神经网络，根据非平衡分子动力学（NEMD）模拟建立的约300条数据，直接从分子结构预测单链聚合物的晶格热导率[79]。训练后的模型具有较高的预测精度，其中卷积神经网络表现出最好的性能，平均绝对误差为5.20 W/mK，RMSE为6.83 W/mK。 Chen等人建立了高斯过程回归模型，使用100个实验数据的数据集预测无机材料的晶格热导率[52]。高斯过程回归模型的准确性与以前的半经验模型相当，使用更容易和快速访问的描述符Fig. 1. 将机器学习方法应用于（a）预测和（b）优化目的的框架。在预测过程中，首先将训练数据输入机器学习算法，以学习描述符和目标属性之间的关系。然后，该模型可以用来预测在训练过程中看不到的测试数据。在优化过程中，首先通过一定的准则（例如随机选择）产生初始代，并通过基于物理的方法评估然后实施机器学习优化算法以选择最接近优化期望的最佳个体以形成下一代。搜索过程将迭代进行，直到获得最优解H. Wei等人能源与人工智能8（2022）1001534[52].这些工作通常开发机器学习模型以建立原子特征与晶格热导率之间的联系。另一方面，也有人努力将异质材料的微观结构特征与有效热导率联系起来。Wei等人训练支持向量回归、高斯过程回归、卷积神经网络模型，通过晶格玻尔兹曼方法基于约1000个训练数据预测二维复合材料和多孔介质的有效热导率[75]。所有三种机器学习模型都比基于物理的有效介质理论模型更准确图2.c显示了卷积神经网络和基于物理的有效介质理论模型的预测误差。卷积神经网络的均方根绝对误差仅为1.9%，较小而有效介质理论模型（Maxwell-Eukken模型为7.3%，Bruggeman模型为18.3%）。 Rong等人使用二维卷积神经网络预测三维复合材料的有效热导率，并基于有限元方法获得的2000个数据的训练数据集输入二维横截面图像[92]。卷积神经网络模型的预测结果与模拟值吻合较好，精度优于三种常用的有效介质理论模型。机器学习方法也被用于预测其他热传输特性，如界面热阻[61，62]。例如，Yang等人尝试了五种机器学习模型，包括线性回归，多项式回归，决策树，图2. 应用机器学习方法预测热输运性质。(a)DFT计算的对数标度晶格热导率（κ）与Slack模型预测值之间的比较[50]。Slack模型严重高估了所有化合物。(b)DFT计算的对数尺度晶格热导率与机器学习（ML）模型预测的热导率之间的比较[50]。高斯过程回归（GPR）预测的晶格热导率与第一性原理计算值吻合得很好。(c)基于机器学习的卷积神经网络（CNN）模型和基于物理的有效介质理论模型的预测误差[75]。CNN模型的预测误差远小于基于物理的有效介质理论模型。(d)基准实验数据与基于物理的扩散失配（DMM）模型预测之间的比较[61]。(e)基准实验数据与基于机器学习的广义线性回归（GLR）模型预测之间的比较[61]。(f)基准实验数据与基于机器学习的GPR模型预测之间的比较[61]。(g)使用不同训练集大小训练的GPR和GPR-RFE模型的预测精度。RFE表示递归特征消除，这是一种描述符降维技术，用于从总描述符列表中消除不相关的特征[52]。GPR-RFE的预测误差低于GPR模型，表明降维步骤可以在降低预测误差的情况下提高模型性能。(h)具有不同结构的人工神经网络（ANN）的测试误差[79]。12层全连通网络的性能优于8层和10层全连通网络。(i)具有不同架构的CNN的测试误差[79]。2卷积层的CNN模型优于1和3卷积层的CNNH. Wei等人能源与人工智能8（2022）1001535×随机森林，人工神经网络，以预测石墨烯和六方氮化硼之间的界面热阻一个小均方误差为0.04510-7 Km2 W-1真正的价值观Zhan等人根据从62篇已发表论文中收集的876个实验数据训练广义线性回归、支持向量回归和高斯过程回归来预测界面的热边界电阻[61]。图2d、e和f显示了基准实验数据和基于物理的扩散失配模型、基于机器学习的广义线性回归和高斯过程回归模型。广义线性扩散失配模型的预测系数R2回归和高斯过程回归的预测精度分别为0.62、0.81和0.92，这表明机器学习模型的预测精度高于基于物理的模型。3.1.2. 预测精度对于预测分析，高度期望利用有限的训练数据实现预测模型的高准确性。预测准确性依赖于三个关键方面：数据集、描述符和机器学习算法[57，58，82]。为了达到高精度，研究人员应该注意数据集的收集，代表性描述符的选择，以及适合可用数据大小和描述符维度的机器学习算法。数据集是数据驱动研究的基石。数据集的大小对机器学习的成功起着重要作用[82，93]。使用更多的训练数据通常表示包含更多的信息，因此会提高机器学习预测的准确性和泛化性能[52，75，92，94]。例如，在参考文献[92]中，作者使用卷积神经网络基于通过数值模拟获得的2000个数据的训练数据集来预测复合材料的有效热导率。当训练数据量从200增加到2000时，测试集的平均绝对误差和均方根误差分别从5.3%下降到3.5%和6.5%下降到4.2%。虽然希望收集更多的训练数据，但这是以大规模实验或数值模拟为代价的[9 5 - 97]。在热输运性质领域，可用数据的大小仍然比材料科学等其他一些领域小得多。因此，选择合适的描述符和机器学习算法来避免大的误差和过拟合就显得更为重要。在大多数研究中，根据目标应用，首先根据文献中的物理理解收集可能的描述符。然后，选择与目标属性强相关的描述符。此外，描述符可以是相互关联的，并且冗余的描述符可以从列表中移除。例如，在参考文献[61]中，总共收集了12个确定热边界电阻的描述符。其中60个使用所有收集的描述符和在文献[52]中，作者应用高斯过程回归模型，使用100个实验数据的数据集来预测无机材料的晶格热导率。采用递归特征消除策略消除初始63维特征向量中不相关的特征，并细化描述符列表。图2.g给出了具有完整描述符集和递归特征消除细化描述符集的高斯过程回归模型的预测误差。在训练集和测试集上。结果表明，降维步骤提高了模型的性能，降低了测试误差。原则上，描述符列表应遵循唯一性、描述性、完整性和简单性的要求[45，70]，如第2所述。对于相同的描述符，不同的机器学习算法的预测精度可能不同。例如，在参考文献[62]中，已经尝试了五种机器学习模型：线性回归、多项式回归、决策树、随机森林和人工神经网络。决策树、随机森林和人工神经网络的预测精度高于其他两种方法。在参考文献[61]中，作者尝试了三种机器学习方法，发现高斯过程回归模型的准确性高于广义线性回归模型（如图2e和f所示）。算法的性能在很大程度上取决于问题的性质，包括描述符的类型和维度、数据集的大小以及超参数的设置[98]。因此，确定使用哪种算法取决于情况。很难甚至不可能先验地判断哪种算法将执行得最好。研究人员通常会尝试几种不同的机器学习算法，然后选择最好的一种作为最终的预测模型。一般来说，对于小数据集，简单的模型具有良好的性能。对于具有高维描述符的大数据集，复杂模型表现更好[82]。但是，在尝试复杂模型之前，仍然建议从简单模型开始。复杂模型（即具有许多参数）可以实现高预测精度，因为它们可以识别识别更多隐藏的输入模式但是，参数太多可能导致过拟合，这对预测性能是有害的[82，99，100]。例如，在参考文献[79]中，作者使用核岭回归、人工神经网络和卷积神经网络来预测单链聚合物的晶格热导率。图2.h和i给出了不同架构的测试误差人工神经网络和卷积神经网络。“FC“和“conv“前面的数字结果表明，12层全连通人工神经网络的性能优于8层和10层全连通网络（图2h）。然而，2个卷积层的卷积神经网络模型优于1个和3个卷积层的卷积神经网络模型（图2i）。我们建议从基本算法开始构建基线模型，如线性回归[101]，逻辑回归[102]和线性支持向量回归[103]。如果获得较大的误差，则可以尝试更复杂的算法，例如内核支持向量回归[103]和神经网络[104]。除了精度之外，还需要考虑实现的容易性、结果的可解释性、可用的时间和成本等。总之，选择哪种算法取决于问题的目标。没有一种算法可以很好地解决所有问题。3.1.3. 机器学习代理模型许多现有的工作表明，机器学习预测模型可以快速准确地预测热传输特性。然而，有必要进一步探索如何更好地使用替代模型来解决以前基于物理的方法无法解决的主要挑战。到目前为止，我们认为有两个应用，其中机器学习代理模型显着优于传统方法。一种是与高通量技术相结合，用于筛选所需的热传输特性[10 5 - 111]。另一个是建立机器学习原子间势，这填补了第一性原理MD和基于原子间势的MD模拟之间的空白[11 2 - 118]。高通量筛选是指在设计空间中穷尽所有可能的材料，并选择最佳材料[111]。由于计算成本的原因，第一性原理预测热输运性质的材料池通常太多。以前，基于分析物理的模型（如Slack模型）用于加速筛选，但预测准确性通常较低[78，119]。机器学习模型可以构建为第一原理计算的替代物，以帮助高通量预测和筛选具有良好准确性的热传输特性。例如，Wang等人用结构和组成描述符训练XGBoost模型，以预测H. Wei等人能源与人工智能8（2022）1001536晶体材料[51]。他们在整个无机晶体结构数据库中的材料上使用了学习的替代机器学习模型，并确定了Cs，Au，Hg，Tl和Pb等重元素有助于降低热导率。他们进一步筛选了具有低热导率的晶体材料，如BiTe2 Tl和Cl2 CsI，并使用第一性原理计算进行了验证[51]。在之前的综述论文中总结了高通量筛选与机器学习相结合以搜索极端热导率的更多说明性示例[57]。随着机器学习算法的适应，更多具有优异热传输性能的新材料被识别出来。它们通常基于数值计算。材料制造和实验测量需要进一步验证高通量筛选的结果。另一个应用是机器学习的潜力。为MD模拟可能是模拟复杂晶体、无序固体的唯一有效方法，它已被广泛用于模拟热传输过程[11]。基于第一性原理的MD模拟具有高精度，但计算成本非常大，限制了模拟到~100个原子和~10 ps[120]。相比之下，基于经验势的MD模拟可以模拟多达106个原子，~1000 ns[121]。然而，精确度受到经验原子间相互作用势的限制.由于原子构型空间中的从头算势能面是高维的，不能用简单的函数形式精确拟合，这些函数形式是基于原子间成键性质的先验知识手动指定的因此，提高经验原子间相互作用势的精度是非常困难的[82，122，123]。相反，机器学习势可以以数据驱动的方式灵活地拟合从头计算势能面，而无需事先指定特定的函数形式[82，122，123]。因此，机器学习的潜力是一个适当的选择，以填补第一原理计算和MD模拟建模热传输之间的差距在过去的五年中，机器学习潜力已经成功开发并用于模拟晶体[124]，非晶材料[112，116]，合金[125，126]，异质结构[127]和各种2D材料的热性能，如石墨烯[117]，硅烯[114]。广泛使用的机器学习潜力框架包括神经网络潜力[128]，高斯近似潜力[129]和谱邻域分析潜力[130]。训练数据来自第一原理DFT计算。研究表明，在一定的温度范围内，散射关系速率，Grüneisen参数，热膨胀系数和总导热系数，从机器学习潜力非常接近第一原理计算[114，115，131，132]。我们希望在未来，更多的机器学习潜力可以集成到流行的MD仿真软件包中（如LAMMPS[133]和GPUMD[134]）。这将极大地促进热输运研究。3.2. 优化与设计除了预测分析，机器学习在热传输研究中的另一个重要应用类别是结构优化。在这一节中，我们首先介绍应用优化方法来寻找具有理想的热传输性能的最佳结构。特别是，我们提出了优越的有效性的优化算法相比，以前使用的随机搜索或直观的设计。然后，我们讨论了提高优化效率的策略。最后，我们说明了优化在发现新模式和潜在物理过程中的重要作用。3.2.1. 优化作为搜索工具为了获得所需的热传输性能，通常进行材料结构的设计和优化[135 -138]。在结构优化设计中，所研究的系统通常具有大量的自由度，这导致了极大的设计空间[135 - 138]。在空间中进行彻底的搜索通常是令人望而却步和效率低下的。相比之下，机器学习优化算法在学习量之间的复杂函数方面是有利的，因此可以在学习函数的指导下有效地搜索设计空间[139，140]。纳米结构具有大的结构设计自由度[141因此，纳米级热传输的结构设计吸引了相当大的兴趣，例如原子界面[55]，合金[54，145]和热超材料[56，85，146- 153 ]，例如，超晶格[56，85，150]，柱撑纳米晶[151]，和纳米网[152，153]。2017年，Ju等人开发了一种结合AGF模拟和贝叶斯优化的方法，用于优化原子界面的热导率[55]。这是纳米级热传输的机器学习辅助设计的早期演示图3.a显示了结合AGF模拟和贝叶斯优化的优化方案的工作流程。该优化方案可以从所有候选方案的仅百分之几的计算中识别最佳结构[55]。他们优化了Si和Ge之间最大热导率的界面。优化的结构如图3b所示。对于最大热导率，最佳结构由Si或Ge原子的连续路径组成，这与物理直观一致。为了最小的热导率，该结构由随机排列的层组成，这是由于波干涉和界面散射效应之间的最佳平衡。有趣的是，机器学习产生的随机结构与早期直觉驱动的使用随机层定位声子和降低热导率的建议一致[154]。Dieb等人也采用蒙特卡罗树来优化具有更多原子的界面的电导[155]。随后，对导热系数（电导率）进行了优化。通过设计的合金的原子构型超晶格和具有纳米柱的纳米带。例如，Yan等人将贝叶斯优化与高通量热导率计算相结合，以搜索SiGe合金的最低热导率原子配置[145]。结果发现，层状结构对降低所有原子构型的热导率最有利，这是由于声子色散曲线的平坦化和交替Si/Ge层的过滤效应造成的。Chowdhury等人将遗传算法与MD模拟相结合，以确定具有最小热导率的由Si和Ge组成的随机多层结构[56]图3.c给出了用于优化Si/Ge超晶格热导率的基于遗传算法的优化方法的示意图，优化结果如图3d所示。基于直觉的手动搜索只产生局部最小值，而基于遗传算法的方法可以通过仅探索设计空间的一小部分来有效地识别全局最小热导率。Hu等人进行了贝叶斯优化，以最大限度地减少通过AGF模拟量化的非周期GaAs/AlAs超晶格中的相干声子热传导[85]。根据优化结果，他们进一步制作了最佳的超晶格结构。实验测得的热导率与全相干计算结果吻合良好，明显小于常规计算结果。周期性超晶格[85]。在他们后来的工作中，他们提出了一个模式分析法，通过它可以有效地获得多变量优化的最优结构[156]。他们首先用一维原子链证明了这种方法的有效性，然后用三维超晶格验证了它。结果发现，通过模式分析方法获得的最优非周期结构的热导率与蒙特卡洛树搜索的优化结果接近[156]。Wan等人还采用了AGF模拟结合贝叶斯优化的策略，通过设计纳米柱纳米结构，H. Wei等人能源与人工智能8（2022）1001537（下一页标题）H. Wei等人能源与人工智能8（2022）1001538图三. 应用机器学习方法优化结构以进行所需的热传输研究。(a)结合原子格林函数和贝叶斯优化的优化方案示意图[55]。(b)Si-Si和Si-Ge界面具有最大和最小界面热导率（ITC）的最佳结构[55]。(c)用于优化Si/Ge超晶格的热导率的基于遗传算法的优化方法的示意图[56]。(d)导热系数随平均周期长度的变化[56]。使用基于人工直觉的优化获得的随机多层结构由菱形表示，并且使用基于机器学习的优化获得的随机多层结构由实心圆表示。紫色虚线表示随机合金限制。(e)两步搜索过程的工作流程[153]。BTE模拟演示的预筛选，然后NEMD模拟进行验证的遗传算法发现的最佳配置。(f)比较了遗传算法使能搜索法和人工搜索法的优化输出和总时间开销。使用洋红色和绿色区分2例成功和21例不成功病例[153]。（g）在四种典型的纳米多孔结构中BTE计算的热流量的大小：周期性结构、从遗传算法获得的具有最高热导率的两种结构使得能够进行两步搜索，以及具有最低热导率的结构。相应的BTE模拟热导率显示在结构下方[153]。(h)用于辐射冷却的热光子发射器的优化结构具有三种候选材料（Al2 O3，Si和SiO2）[164]。结果表明，最佳的结构是由Si和SiO2组成.(i)最佳结构的发射率。绿色矩形线表示理想的选择性发射度[164]。(j)基于CNN模型的搜索算法示意图。从所有候选结构的池中随机选择100个结构，并通过MD模拟计算它们的热导率。CNN模型被训练为第一代替代预测模型。然后使用CNN模型预测所有剩余结构的热导率，并选择热导率最低的新的100个结构。这100个新结构的真实热导率是根据MD模拟计算的，这些数据被添加到训练集中，用于训练下一代CNN模型[152]。CNN代理预测模型像这样迭代更新，直到获得最优解。(k)在基于CNN模型和随机搜索的搜索方案优化的逆向设计期间，每一代中前100个结构的平均热导率[152]。[151].据观察，热导随着纳米柱的增加而非单调地减小，这是由于共振杂化和声子相干的竞争效应。先前的研究已经得出结论，由于声子Anderson，无序结构导致比周期对应物更低的热导率定位[157 -160]。这些研究的机器学习辅助材料设计进一步探索了热导率（电导率）的下限[56，85，152]。然而，Wei等人通过寻找例外来挑战这一公认的知识[153]。他们设计了一种手动搜索是昂贵的和不成功的。相反，遗传算法使能的方法以少得多的计算成本成功地搜索出具有较高热导率的无序结构。最近，Chowdhury等人通过使用基于CNN的预测方法的自适应搜索，发现与周期性超晶格相比，非周期性超晶格中的晶格热导率意外增强[150]。他们发现，基于CNN的搜索过程可以利用200个CPU小时在两次搜索迭代内成功识别增强。相比之下，人工随机搜索即使在花费双倍的模拟时间后也会失败。虽然GA搜索可以识别合理的高热导率，但仍然没有超过参考超晶格热导率。这些工作开启了在反直觉空间中执行优化的方案，并可能获得意想不到的结果并揭示相关的新物理学。一些研究进行了多功能优化的治疗，电动品质因数例如，Masaki等人在多孔石墨烯纳米颗粒中进行了结构优化，以实现结合格林函数方法和贝叶斯优化的高热电性能[161]。多功能结构优化的效率是随机搜索的5倍。优化的热电优值被发现是原始石墨烯纳米颗粒的11倍。Cui等人还利用贝叶斯优化和格林函数方法来搜索缺陷-石墨炔纳米带的最佳热电转换效率[162]。贝叶斯优化的效率明显高于随机优化。即使在最差的一轮优化中，仅需计算所有结构参数的4.35%，就可以有效地搜索到最佳缺陷-石墨炔纳米颗粒。最佳缺陷的热电优值- 石墨炔纳米粒子（长和宽分别为11.846 nm和1.453 nm）的平均粒径高达2.315，是原始-石墨炔纳米粒子的5倍。还研究了辐射性能的结构设计。在此外到的热电导率（电导），和为了提高热电性能，还进行了辐射性能的优化。例如，Sakurai等人设计了一种结合贝叶斯优化和热电磁场计算的超窄带波长选择性热辐射器[163]。所得到的超材料是表现出188的Q因子的非周期性多层超材料，这显著高于过去凭经验设计和制造的结构的Q因子。Guo等人结合了严格的耦合波分析和贝叶斯优化来设计用于辐射冷却应用的热光子结构[164]。贝叶斯优化方法可以通过从19，683个候选中计算不到50个候选来确定最优结构，而随机搜索需要4500个。最佳结构原来仅由Si和SiO2组成（图3h），并显示出与大气窗口完全匹配的光谱选择性（图3i）。Hu等人通过优化Tamm发射器结构来实现蒙特卡罗树搜索算法以最大化热光伏系统的功率密度和系统效率。通过优化，获得了非试验性非周期性Tamm发射器，就TPV性能而言，金属侧发射器是优选的[165]。他们还在红外范围内优化了Tamm发射器，以实现高Q因子和高发射率，同时使用蒙特卡洛树搜索。获得了Q因子为508且在4.225µm处的发射率峰值为0.92的最佳结构[166]。3.2.2. 优化效率在最优化问题中，设计系统通常具有很大的自由度。因此，优化问题通常是高维的.在这种情况下，先进的优化算法在搜索具有期望的热传输特性的最佳结构方面比随机搜索或基于物理直觉的调整更有效。另一方面，计算或实验成本相对较大，使得可用数据量有限。因此，可以考虑的候选数量是有限的，因此优化的效率很重要[58]。然而，目前的结构优化与有效的优化算法仍然遭受由数值模拟在评估候选人的热传输性能和优化本身的计算所引起的大的计算成本。为了提高整个优化过程的效率，一种方法是最大化优化算法本身的效率。原则上，问题的复杂性，例如自由度和候选总数，对某个算法的性能有很大影响[57]。例如，当候选人的总数在几十万的数量级时，贝叶斯优化是非常有效的[64，165，167]。当候选人的总数大得多甚至无限时，贝叶斯优化变得不那么有效[64，165，167]。而且效率还取决于算法的细节，例如H. Wei等人能源与人工智能8（2022）1001539描述符的选择，每次迭代中考虑的候选人数量以及算法中的超参数[89，90]。例如，二进制标志值、库仑矩阵和质量矩阵描述符比本征值描述符更有效地优化超晶格结构以实现最小热导[64]。因此，特定算法的效率是大小写敏感的。尽管如此，建议根据优化问题的复杂性选择算法，并仔细检查选择这些决定性因素。另一种不同的方法是降低评估候选人属性的成本。一种策略是分层优化，即，先用粗估计量进行预筛选，再用精确估计量进行验证。例如，在参考文献[153]中，作者提出了一种用于优化纳米多孔石墨烯热导率的“两步“搜索协议。在通过基于BTE的遗传算法进行预筛选之后，应用NEMD模拟来验证优化的优化结果。图3.f显示了遗传算法启用的搜索方法和手动搜索方法之间的优化输出和总时间成本的比较。人工搜索被证明是昂贵的（花费67，200核心小时）和不成功的。而在遗传算法启用搜索中，在具有随机孔的某些结构中成功地发现了意想不到的热导率增强，其计算成本是手动搜索的一小部分。另一种策略是建立预测代理模型来代替计算昂贵的数值模拟。例如，Wan等人提出了一种基于卷积神经网络预测模型的逆向设计方案，以最小化纳米多孔石墨烯的热导率[152]。示意图如图3j所示。首先，从所有候选结构的库中随机选择总共100个结构，并通过MD模拟计算它们的热导率。基于这100个训练数据，预测模型被训练为第一代替代预测模型。然后应用第一代模型来预测所有剩余结构的热导率，并选择具有最低热导率的新的100个结构。这100个新结构的实际热导率是从MD模拟计算出来的，这些数据被添加到训练集中，用于训练下一代预测模型。卷积神经网络代理预测模型像这样迭代更新，直到搜索出最佳结构。这两种策略可以避免直接计算昂贵的计算，从而加速优化过程图3.k显示了在通过基于模型和随机搜索的搜索方案进行优化的逆设计期间，每一代中前100个结构的平均热导率。可以看出，平均热导率的随机搜索方法收敛缓慢。相反，基于该模型的搜索方案在第7代时快速收敛到真正的最优值。这项工作表明，基于该模型的搜索方案能够比随机搜索更有效地找到热导率最低的结构[152]。上述介绍的策略仍然基于优化算法，这些优化算法是基于规则的方法，包括逐案迭代搜索，例如遗传算法[89]，贝叶斯优化[90]，蒙特卡洛树搜索[91]。在每个步骤中使用数值模拟来计算候选物的热性质，以帮助修改搜索过程。这些随机算法的效率受到其随机搜索性质的限制，因此不足以用于复杂的设计。最近，一种完全不同的设计策略被用于光子结构的设计，这是基于深度神经网络的设计[168 - 170]。如3.1节所述，神经网络可用于建立结构参数和属性的映射，通常称为前向建模网络。另一种类型的神经网络将属性作为输入并直接输出结构，这被称为逆设计网络[168 - 170]。典型的深度学习架构包括多层感知器[171]，卷积网络[172]，递归网络[173]，生成模型[174]等。这些神经网络可以从大量数据中自动发现有用的信息，并在几分之一秒内完成设计，而无需任何迭代优化，与基于物理或规则的方法形成鲜明对比，这也适用于热传输特性设计。3.2.3. 机器学习搜索工具由于有效的搜索，优化方案特别适用于第3.2.1节中介绍的材料设计。此外，优化方案还有助于发现新的物理机制。例如，在参考文献[85]中，尽管预期优化的无规结构中的热导率比周期性结构低，但是作者研究了优化的非周期性超晶格中声子输运的潜在

下载后可阅读完整内容，剩余1页未读，立即下载