冬季2022芯片1，半导体机器学习评论人工智能

174 浏览量更新于2023-12-09 收藏 2.78MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，1000331月16芯片评论人工智能DOI：10.1016/j.chip.2022.100033半导体机器学习刘端扬1，徐黎明2，林旭民3，邢伟4，5，于文杰4，5，王扬2，魏&忠明1，5，刘1中国科学院半导体研究所超晶格与微结构国家重点实验室中国科学院计算机网络北京化工大学数理学院，北京100029 4中国科学院上海微系统与信息技术研究所信息功能材料国家重点实验室，中国科学院大学电子邮件：wangyang@cnic.cn（Yang Wang），zmwei@semi.ac.cn（Zhong-MingWei）Cite as：Liu，D.-Y. 等人半导体的机器学习芯片1，100033（2022）。https://doi.org/10.1016/j.chip.2022.100033投稿时间：2022年接受日期：2022年在线发布：2022年11月11日随着电子技术水平的不断提高，半导体材料科学和半导体制造业在过去几十年中得到了蓬勃发展，积累了大量的数据。如果对这些数据进行有效的分析，将有助于发现新的半导体材料和发展半导体制造业。幸运的是，机器学习作为计算机科学中快速发展的工具，有望大大加快数据分析的近年来，关于半导体材料和半导体制造的机器学习研究已有许多报道。本文介绍了这一领域的研究进展，并展望了该领域的发展前景。介绍在过去的几十年中，半导体器件的尺寸已经变得越来越小，并且每年的产量都大大增加基于这些半导体器件的电子产品这一成就归功于半导体制造业的发展和材料科学的迅速进步。另一方面，在半导体材料科学和半导体制造这两个领域中，已经积累了大量的数据，并且产生了无数的相关问题。因此，除了传统的研究方法外，还需要更有效的方法来处理这些数据和问题。近年来，机器学习（ML）取得了巨大的成就，它影响了计算机科学2-8之外的许多其他领域，在材料科学中，已经积累了数百万种材料的各种实验数据和模拟计算数据，并建立了一些相关的材料数据库同时，对硅片进行验收测试，通过扫描电子对硅片进行贴图在相关产品线上积累了大量的SEM或光学方法、最终测试等数据，并将其中的一些数据收集起来建立公共数据库，作为SECOM数据集为了充分利用这些海量数据，半导体材料科学和半导体制造领域的研究人员正在努力开发和应用各种ML算法。半导体上ML的一些重要标志已在图中示出。1.一、2006年，Hinton et al.9提出了一种名为Deep Belief Nets（DBN）的神经网络从那时起，名为“深度学习”的概念在ML领域变得流行，并提出了越来越多层的神经网络。同时，ML方法也被广泛应用于计算机科学以外的许多领域Blum等人10建立了一个名为Generated Database-13（GDB-13）的数据库，其中包括2009年的9.7亿个小分子。之后，其他材料数据集，如材料项目11，QM912和计算二维材料数据库（C2DB）13已经建立。这些材料数据库可以为半导体材料科学的机器学习提供大量的数据。2010年，McCann et al. 14建立了一个公共数据库，该数据库代表了从晶圆生产线获取的工艺相关数据的选择。该数据库名为SECOM，是一个关于半导体制造的公共数据库。它已被用于晶圆生产的一些ML研究15库仑矩阵（CM）18和原子轨道平滑重叠（SOAP）19分别于2012年和2013年提出。这两个都是基于原子坐标的描述符。这类描述子有助于将原子位置的细节转化为ML方法的输入。在2018年，Wang等人提出了一种流行的机器学习力场（MLFF），名为DeePMD-kit。该框架在精度和速度方面都有较好的性能。在目前的工作中，我们的目标是介绍有关半导体的最新发展。为了对这一领域进行全面介绍，本文的结构如下。第二部分介绍了该领域中一些流行的机器学习模型或算法，第三部分以半导体材料科学为例介绍了机器学习的学习过程，第四部分介绍了机器学习在半导体材料科学和半导体制造领域的一些进展，最后在第五部分进行了简要的总结，并对该领域的发展前景进行了展望。机器学习建模自从1959年Samuel24提出ML以来，各种ML概念和算法已经被开发出来。这些方法大致可以分为三类：监督学习、无监督学习和强化学习。监督学习要求训练数据中的每一个样本都要有明确的特征和标签，或者说“原因”和“结果”，并期望学习出一个能够将标签和特征联系起来的模型，这样这个模型就可以给其他合理的样本赋予标签图 2审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，1000332月16日图1| ML在半导体上的一些重要里程碑。深层神经网络。转载请注明出处。第九章麻省理工学院出版社。转载请注明出处。20.© 2018 Elsevier B.V.b，晶圆验收测试（WAT）的SECOM数据库14. c，基于原子坐标的SOAP描述符19，21。d、GDB-13材料数据库10. e，基于原子坐标的CM描述符18、22。转载请注明出处。10 18 19 21 22© 2009，2012，2013，2019美国物理学会。f，一种流行的MLFF框架DeePMD套件。转载请注明出处。23岁© 2018 Elsevier B.V.图 2|监督学习的流程图。从概念上展示了监督学习的流程图输入数据的原始特征和标签分别用X_raw和Y表示。作为监督学习的一个例子，图3显示了ML辅助结构色逆设计的实际应用。在训练数据中，目标Lab颜色值是标签。无监督学习的训练数据从零开始的模型可以通过强化学习获得，而无需先前的数据。在学习过程中，程序尝试并访问结果，然后更新策略，以获得更好的结果，然后再次尝试，循环直到结果足够好。半导体的大多数ML任务涉及分类，预测一些材料特性以及设备或人的性能。出于这个原因，ML在这个领域的大多数应用都在监督学习的范围内。由于材料科学和半导体制造中存在大量的数据，监督学习正成为这些领域研究的有力工具在本节中，我们将介绍半导体的数据准备和一些流行的ML算法。从字面上讲，ML是指统计学习，或在大多数情况下基于统计学习理论的ML。顾名思义，统计学习从大量数据中获取统计信息。更具体地说，假设所有数据背后都有一个隐藏的、未知的统计分布，数据中的每个条目都是从这个分布独立生成的。因此，这种假设被称为-审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，1000333月16日图3| ML辅助结构色逆向设计的实际应用。a、目标颜色和设计颜色的颜色显示（Lab颜色模式）。b、前向神经网络用于颜色预测。转载请注明出处。八、©2022 Optica出版集团。相依同分布（Independent Identical Distribution，IID）在这种假设下，ML的任务是找到隐藏的统计分布，更具体地说，找到一个足够接近隐藏的统计分布的统计分布。ML的输出模型只是对已发现的统计分布的表示，因此数据准备是非常重要的。数据应满足以下三个条件：(1)适合于训练目标模型：如果原始数据不适合，则需要进行一些变换;（2）足以表示背后的规则并训练好的模型;（3）尽可能忠实地给出隐藏的在材料科学中，已经有一些高质量的数据库，如MaterialProject11，C2 DB13，AFlow25，26，GDB-1310，QM 912等，这些数据库已经用于ML研究。另一方面，一些研究人员正在尝试建立基于高吞吐量计算和ML27-30的其他数据库其中，一个有趣的事情是从网上无数的论文中收集数据，技术是文本挖掘和自然语言处理31。如果没有合适的现有数据库用于材料科学中的ML，研究人员必须自己生成数据。根据机器学习中使用的原始特征，无论数据是否来自现有数据库，用于描述材料样本的原始特征可以分为以下三种类型：(1) 原子构型。对于这种类型，原始特征是所有原子这是最常见也是最复杂的一种特征类型，不仅因为转换后的特征类型繁多，而且还因为各种原始数据没有统一的例如，在某些ML情况下，可能包含化学键信息，因为研究重点是化学反应。这类数据主要来源于分子动力学或从头算分子动力学，几乎不能直接作为ML模型的输入，因此人们开发了另一方面，在一项研究中，这些数据的标签通常是能量和力，因此相关的ML任务主要是回归问题。(2) 亚当的信息在一些ML问题中，研究人员关注的是原子类型的影响，那么原子的位置是不必要的。另一方面，在这些特征类型中，不仅可以用原子序数作为特征，还可以用原子的其他性质作为特征，如负性、Shannon半径33等。在这些特征类型中，存在多种原子位置，不同的原子位于这些位置，所用的特征是不同位置类型的原子性质。利用这些特征可以对材料进行分类和预测，也可以制备目标标记物通常，这些特征可以直接用作ML模型的输入，但通过特征工程选择合适的特征通常是一项重要的任务。(3) 材料的性质，如晶格常数、空间群、吸收光谱等，这种特征类似于原子即既适用于分类又适用于回归，不需要变换，需要特征工程。对于半导体制造中的ML，数据准备相对简单。虽然数据量也是巨大的，但这些数据在大多数情况下都可以直接使用。在这一领域，专门为研究产生新的数据是不合理和不必要的，因为当问题被提出时，在大多数情况下意味着有足够的数据可以处理。如果研究人员只是对该领域的理论感兴趣，也可以使用一些数据库，如SECOM。在大多数任务中，使用的特征是工艺参数或测量结果，ML模型的对象是分类。一些流行的算法算法是ML的另一个基本元素自1957年ML被提出以来，已经提出了大量的ML算法。这些算法中的许多已被用于半导体的ML选择合适的ML算法是ML研究的一个重要问题。对于监督学习，分类和回归问题有不同的适用算法。另一方面，如果特征与目标属性之间的在本小节中，我们将介绍该领域中一些流行的ML算法审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，1000334月16日−联系我们− }=表1|算法和缩写。缩写术语描述SVM支持向量机分类算法KRR核岭回归回归算法，一种流行的核方法DT决策树分类算法，一些回归版本RF随机森林/随机决策森林分类/回归算法ID3迭代二分法3分类算法，DT的一个版本C4.5C4.5分类算法，DT的一个版本推车分类回归树分类/回归算法，DT的一个版本NB天真的贝琪分类算法LassoLeast Absolute Shrinkage and Selection Operator分类算法RVM相关向量机分类/回归算法，核方法的一个版本GPR高斯过程回归回归算法，KRR安人工神经网络流行的分类/回归算法，有许多分支DNN深度神经网络深度ANN，具有多层DBN深度信念网络一种神经网络，最早的DNNGNN图神经网络一种神经网络CNN卷积神经网络一种流行的神经网络GA遗传算法零阶分类/回归算法，无需梯度DE差分进化分类/回归算法，GA的一个版本TL迁移学习概念/算法，基于训练模型进行微调表2|除了算法之外的缩写列表。缩写术语描述ML机器学习人工智能的热门领域IID独立同分布关于数据MD分子动力学原子运动的一种模拟方法MLFF机器学习力场用ML拟合MD力场的一种方法MLIP机器学习原子间势MLFF的别名CM库仑矩阵基于原子坐标RCM随机库仑矩阵基于原子坐标MBTR多体张量表示基于原子坐标ACSF原子中心对称函数基于原子坐标肥皂原子轨道的光滑重叠基于原子坐标CGCNN晶体图卷积神经网络半导体材料的分类和性质预测模型CEP财产粗估对目标财产PLMF属性标记的材料碎片基于属性DMSS稀磁半导体一种半导体VASP维也纳从头算模拟程序包一个流行的密度泛函理论ADC自动缺陷分类缺陷自动分类系统FDC缺陷检测及分类故障检测与分类研究进展C2DB计算二维材料数据库二维材料数据库abr流量自动流量材料数据库GDB-13数据库-13材料数据库QM9QM9材料数据库SECOMSEmiCOnductor制造数据集半导体制造的半导体。由于许多算法将出现在当前的工作中，并且每个算法都有其首字母缩写，我们在表1中列出了一些流行的算法。在该表中，列出了每种算法的简要说明。表2中列出了除算法外的一些术语。支持向量机有监督学习的任务可以大致分为两类：分类和回归。分类算法大致可以分为线性和非线性两类支持向量机（SVM）有线性和非线性算法。SVM不仅仅是一个经典的算法34.它的概念启发了许多其他算法，特别是对偶算法和核函数概念35在许多流行的算法中使用。在许多监督问题中，我们可以将训练数据表示为其中xi是第i个样本的特征，或者说数据点，yi是xi的标签。对于SVM算法处理的二进制分类问题，我们有y i1，1，i 1，2，. . .、N.线性支持向量机试图给出一个具有最大软间隔的（n1）维超平面，而非线性支持向量机试图在一个新的特征维度上做类似的事情，其中新的特征是从Rn中的初始特征xi转换而来的。对于分类，支持向量机是一个强大的工具。对于半导体来说，它在材料科学和半导体制造中得到了广泛的应用。在材料科学中，SVM已用于预测一种材料是半导体还是金属36-45，一种半导体的间隙是直接的并且在半导体制造中，SVM已经被用于对晶片的缺陷49设置：T={（x 1，y1），（x 2，y2），. . . ，（x N，y N）}，xi ∈ Rn，i = 1，2，. . . ，N，（一）KRR核岭回归（KRR）是一种代表性的核方法59。如上所述，内核方法的概念起源于审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，1000335月16日==×非线性SVM也是一种核方法。在核方法中，核是核，它隐式地将初始特征转换到新的高维特征空间。这将带来两个好处：一是表达能力更强，二是在原特征空间的非线性拟合效果在新特征空间的线性拟合效果为了避免复杂的计算，新的特征相反，它们的内积由核函数计算：k（xi，xj），i， j一，二，. . ，N，其中k（.，. ）是内核函数，一般来说，它应该是对称半正定实际上，k（xi，xj），j1，2，. . .，N代替xi作为第i个样本的新特征。基于这些新特征，可以应用线性分类或线性回归很明显，ML的性能很大程度上依赖于核函数，因此选择合适的核函数对于核方法来说是非常重要的。如果在最后一次线性回归中加入岭项以避免不稳定的结果，则它是KRR。通过选择合适的核函数，KRR具有误差小、稳定性高的优良回归性能因此，KRR已被广泛用于半导体的ML研究32，44，60，61。由于KRR方法需要一个N NGram矩阵，其中N是样本点的数量，因此它更适合于小系统或小样本的问题，如有机材料22，30，62，63。决策树和随机森林虽然决策树（DT）算法CART64可以用于回归问题，但人们更喜欢使用DT来解决分类问题。使用经过训练的DT，可以正确地对新示例进行分类。类DT的生成有一个循环，分为两步：按一定规则选择特征，根据所选特征的值集在目前流行的DT算法中，ID365和C4.566采用信息增益或信息增益比作为特征选择的判据，更适合于离散特征。而CART算法采用Gini指数作为特征选择的判断标准，更自然地适用于特征连续的问题。为了避免过度拟合，有必要修剪生成的DT树。在剪枝过程中，一些子树被减少到它的根节点，这可以看作是结构风险最小化。在生成DT树时如果需要对新样本进行分类，则可以从每个DT获得分类结果，然后可以使用多数投票来决定新样本这是一个著名的算法，名为随机决策森林（RF）67。RF可以被视为DT的扩展DT和RF算法已广泛应用于半导体材料和制造的许多问题，如预测间隙39，41，44，45，63，68，69，其他材料性质40，43，47，48，70深度神经网络（DNN）是一种“深度”人工神经网络（ANN）。这里的“深度”意味着网络中有许多层，但是“许多”或“深度”的阈值有多少层是不确定的。由于只有一层的ANN很少，一些研究人员将DNN视为ANN78的另一个名称。人工神经网络具有极强的表达能力，只要有足够的节点或参数，它几乎可以以任意精度逼近任何DNN可以自动提取样本或输入数据中隐藏的深层特征。由于这两个优点，DNN和ANN已被用于许多研究。在半导体方面，研究人员将其应用于形成能30，33，79，间隙43，44，63，80-除了SVM、KRR、DT、RF、ANN和DNN之外，还有许多其他算法被应用于半导体材料和半导体制造的研究。限于我们的学术水平和本文的篇幅，我们不可能介绍这一领域的每一种新的算法。相反，我们想在本小节中介绍其中的一些。线性拟合方法是一组基本而实用的方法。它可能不适用于一些非线性因素的问题，但它具有计算复杂度低的优点。线性拟合方法已被用于预测间隙37，40，44，磁性能105，改善晶圆质量49，56，提高制造良率51等; Boost算法可以改善某种学习模型的训练效果，因此在半导体的许多领域得到了应用15，44，49，51，54，56，58，106.主动学习是一种最先进的算法，它允许在应用于预测时改进学习的模型。因此，它已被应用于处理一些难以在训练前收集足够合适数据的问题，如机器学习力场（MLFF）71，107。除此之外，半导体领域的研究人员还使用了其他算法，如遗传算法（GA）42，86，108、朴素贝叶斯（NB）16，57，109、迁移学习（TL）69，101，110等。半导体材料科学中的学习过程随着材料科学的快速发展，出现了大量的材料数据，包括半导体材料。此外，甚至某种半导体材料的数据也具有非常高维的自由度。用传统方法分析这些数据几乎是不可能的，这就是ML被广泛使用的原因根据ML中所用材料的性质，ML方法可以大致分为两类：(1)材料的宏观信息，如晶格常数、空间群、弹性模量等;这是传统的描述符，为了方便起见，我们称之为宏观性质描述符;（2）每个原子在这些研究中，可以根据每个原子的信息来预测宏观和微观在本文的下一部分，它将被称为原子坐标描述符。图4a和b显示了将原子位置转换为描述符并预测能量的策略之一。在本节中，我们将介绍半导体材料中的监督ML过程正如我们在上一节中介绍的那样，监督学习试图训练一个可以将输入x映射到输出y的模型它需要适当的数据与标签，一个很好的代表输入X.鉴于目前互联网上有庞大的材料数据库，根据研究主题从现有数据库中收集特定子集也往往是一种很好的抽样方式。采样对于任何监督学习，最重要的事情总是关于适当的数据。没有免费的午餐定理112表明，如果训练集与测试集无关，则任何模型几乎所有的算法都需要一个名为IID的假设来保证算法的有效性。IID意味着训练集和测试集都是从相同的统计分布中生成的因此，为了获得有用的结果，我们应该仔细收集训练数据我们收集训练数据和期望预测的条件应该尽可能相同进行这种采样的一个好方法是修复大多数条件。例如，Westonet al. 46集中于锌黄锡矿I2-II-IV- V4半导体的带隙性质根据研究课题，仅对三种阳离子和一种锌基锌黄锡矿结构进行置换，就得到了1568种可能的阴阳离子组合图 4 C审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，1000336月16日图4|转换原始特征和学习过程：a，用于基于原子坐标进行ML的神经网络的示意图90。b，基函数，用于构造满足面板a中对称性要求的函数90。转载请注明出处。90岁。© 2018美国物理研究所。c.通过替换阳离子和固定空间群来取样。转载请注明出处。第四十六章。© 2018美国物理学会。d.基于特征工程的材料ML流程图。转载请注明出处。第三十九章。© 2021 Elsevier B.V.e，使用MLFF通过MD模拟预测的温度变化转载请注明出处。90岁。© 2018美国物理研究所。示出了在锌基锌黄锡矿结构中的这种取样策略。通过使用一个子集的DFT计算的间隙作为标签，他们得到了非常准确的间隙预测在其他组件。类似的方法也用于其他研究28，39，79，106。Hou等人113只关注一种材料Al 23。5 + x Fe 36. 5 Si 40−x。他们收集了不同化学化合物的热电特性位置参数x、温度T、晶格常数作为训练数据。基于这些数据，他们训练出了一种低成本、高效率的探地雷达该模型可以预测低、中温区的导热系数。其他一些小组也研究了某些性质在不同的化学成分和环境条件下的某些材料36，114。另一种方法是从现有材料数据库中选择子集许多关于有机材料的ML研究选择了GDB-17中的一些特殊材料。Faber等人63使用QM9，GDB-17的子集，仅包括含有多达9个重原子的小有机分子作为训练数据。他们表明，对于许多属性，ML的误差始终优于DFT63的估计误差。汉森等人22的随机库仑矩阵描述符优于GDB-17的另一个子集GDB-13中的库仑矩阵描述符。其他研究选择MaterialsProject69、79、80和C2DB29、41中的部分材料作为训练数据。选择一种特定的材料作为训练数据还有另一个原因。由于所有已知材料的数量太大，而且这些材料的多样性令人难以置信，因此几乎不可能建立一个可以包括所有材料的机器学习模型。如果训练数据不能表达测试数据的隐含分布，我们可以选择新的训练数据进行再训练。这个循环就是所谓的主动学习。这是最先进的抽样方法。在MLFF中，该方法已被广泛使用，并且存在几种类型的实现。在这种方法中，如何评估训练的模型是否可以预测新榜样是不是核心问题。典型的方法是探地雷达，Jin-nouchi等.表明该方法可以很好地预测钙钛矿107的相变。特征工程判断描述子是否能够表达特定的特征，对于研究对象具有重要这是决定ML结果好坏的另一个核心因素本工作属于ML的特色如果以材料的组分原子确定特征是否与目标属性强相关）。特征选择已被用于预测半导体的带隙39，60，106和铁电性28 图 4d示出了具有特征工程39的ML的流程图。如果用原子的所有位置来表示材料，很难直接用位置来描述材料。在这种情况下，需要将位置转换为另一个描述符。考虑到物理理论，新的描述子应满足位置的旋转、平移因此，研究者们发展了一些描述符，如库仑矩阵、埃瓦尔德和矩阵、正弦矩阵、多体张量表示（MBTR）、原子中心对称函数（ACSF）、原子轨道光滑重叠（SOAP）等。训练和预测ML有三个基本要素：模型、策略和算法。模型和算法已经在本文的前一部分在本节中，我们将讨论培训策略。几乎所有的ML研究都面临着相同的基本问题，即如何平衡过拟合和欠拟合。调整超参数是解决这个问题的最重要的工具超参数，审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，1000337月16日像SVM的核函数、DT的节点、RF树的数目、神经网络的层数和神经元数目决定了ML模型的复杂性和表达能力。选择合适的超参数就是选择适合ML问题的复杂度和表达能力验证是一种常见的工具来做这项工作22，37.更重要的是，对训练模型和预测的统计分析将有助于评估模型是否成功25，61，116。一般来说，当一个模型已经训练好，应用它来预测新例子的目标属性是唯一的工作。但总有一些例外，如主动学习，需要在最终预测之前交替进行训练和预测另一个例外是MLFF，MLFF的目标不是直接预测某些属性训练的力场可用于运行快速和准确的分子动力学（MD）模拟。许多性质可以从这些MD模拟87，89，90，107，111，115，117图4e示出了使用MLFF90的MD模拟的温度变化。半导体机器学习的研究现状在本节中，我们将介绍近年来根据领域，这些内容将在三个小节中介绍。新材料发现分类是机器学习的一个主要范畴。因此，将半导体分为不同的类别是该领域的一个重要课题29，46，79，83，106，127，并且分类有利于发现新材料。通过使用晶体图卷积神经网络（CGCNN），谢等。79研究了钙钛矿的能隙、形成能和其他性质。特别是，他们成功地预测了这些钙钛矿的金属和半导体分类图5a显示了如何将具有原子位置的晶胞转换为晶体图。 5B显示如何将晶体图作为神经网络的输入。图5c显示了9350个测试晶体预测的接收器工作特性曲线通过选择0.5的阈值，他们得到了0.90的整体Tao等人39使用人工神经网络加速发现具有更高产氢速率的新型钙钛矿可见光催化剂。采用宏观性质描述子，用多种ML方法和算法预测了30，000个ABO3型钙钛矿结构的能隙和产氢他们发现ML方法比传统的搜索方法更有效，并且预测14种钙钛矿的产氢率高于训练数据集中的最高值。Weston等人46将锌黄锡矿I2通过使用SVM，他们发现这些半导体的直接-间接分布取决于阴离子。图5d显示了氧化物、硫化物、硒化物和碲化物的带隙的直接-间接分布。Ma等人91使用新的基于电子轨道的描述符系统地研究了2964个二维从这些磷酸盐中发现了44种铁电半导体，其中7种含有多铁性。推测铁磁性主要来源于铁原子相对位移引起的对称性自发破缺图 6示出了示意性过程和预测结果。此外，还有一些发现新半导体材料的ML研究报告，如二维半导体28，40，70，72，有机半导体71，以及其他27，44，68，106。性质预测材料科学中ML的主要目的之一是预测各种材料的物理或化学性质。人症另一方面，它是发现新材料的工具。对于半导体来说，情况也是类似的，关于半导体的各种性质已经有了各种各样的研究报告，包括力学、热学、声学、光学、电学和物理学。图5|基于原子位置单元的晶体图的构造79. b，晶体图作为神经网络79的输入。c，显示金属-半导体分类结果的受试者工作特性曲线79。d，氧化物、硫化物、硒化物和碲化物的带隙的直接-间接分布46。转载请注明出处。4679© 2018美国物理学会。审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，1000338月16日图6|发现铁电材料M I M IIP2X6的示意性过程。ML过程的流程图在左部分，右部分示出预测结果。转载请注明出处。第九十一章。© 2021 Elsevier B.V.图 7|一些ML模型中的E g预测。a，使用GGA带隙和不使用GGA带隙（CEP）作为特征之间的比较61。b，使用与实验测量具有不同相关性的粗略估计61.转载请注明出处。61岁。© 2018自然出版集团。c，来自通过NN算法的DFT计算的测试集中的双层的带隙d，除了使用RF算法之外，与面板c相同e，除了使用相关向量机（RVM）算法之外，与图c相同f，除了使用SVM算法之外，与面板c磁力学许多研究集中在电容器的电性能36- 38，40，42 - 44，61 - 63，71，73，79，81，106，118，128 -130。为了提高小规模数据库造成的低精度，Zhang et al.61将粗略的属性估计（CEP）结合到现有特征中。这里，CEP是指对目标属性的粗略估计。通过在特征中加入CEP，他们显著提高了沸石间隙、晶格热导率和弹性的预测精度一些二元或三元半导体。图图7 a和b表明，ML预测值与实验间隙之间的关系是明显的线性关系，即使在极低或极高的值范围内也没有大的偏差，显然CEP显著改善了预测。为了探索混合范德华异质结构的参数空间，快速预测双层异质结构的层间距和带隙，Tawfik等人，43个组合的几个ML审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，1000339月16日DFT的结果。通过使用属性标记的材料片段（PLMF）描述符，该方法产生了相对较高的和实际有用的预测精度。图7c和f显示了DFT的间隙与四个ML模型的间隙之间的比较。也有一些研究集中在磁性45，70。Khmaissia等人105将RReliefF特征选择与最小绝对收缩选择算子（LASSO）相结合，对稀磁半导体（DMS）的磁性进行了预测。他们分析了大量系统的描述符，发现只有30%的特征更有可能对客观属性做出贡献。通过使用这些减少的特征，均方误差减少了20%。稳定性对于材料计算是非常重要的。半导体中的许多ML研究涵盖了稳定性验证，一些研究集中在稳定性30，33，48，80，114。Hansen等人22在库仑矩阵（CM）的基础上提出了一种新的描述子--随机库仑矩阵（RCM）。通过应用这个描述符，这个小组测试了几种算法来预测小分子有机半导体的形成能和其他性质他们发现这个描述符比CM和排序库仑矩阵更好。半导体材料的热和声学性质也是ML领域研究的热点. 47,87,87,131后等人113集中于不同组分Al 23的热电性能。5 + x Fe 36. 5 Si 40−x在不同温度下，在分段抽样中巴托克等人123提出了一种ML方法，金刚石、硅、锗等半导体的许多性质的预测。他们首先从原子坐标建立了一个描述符，然后应用高斯过程回归（GPR）将这个描述符映射到目标属性，包括表面能，声子色散。这一工作启发了半导体ML研究中的许多其他研究，也是半导体ML FF研究的早期。与直接从描述符预测性质相比，多层膜函数是另一种方法。在MLFF中，稳定性，热性能和其他性能可以通过使用训练的力场的MD模拟来预测。该领域的论文数量众多32、87、89、111、118为此，出现了一些用于该研究领域的软件，如DeePMD-kit23、Describe115、sGDML125等。著名的DFT软件维也纳从头算模拟软件包（VASP）小组也在VASP中开发了作为示范，该小组提出VASP的MLFF可以预测混合钙钛矿107的相变。利用MLFFF进行分子动力学模拟，并采用on-the-fly算法，对混合钙钛矿MAPbI3进行了正交相到四方相，四方相到立方相的相变。图8示出了这种相变和通过MLFF获得的三个相位。Hu等人132应用MLFF预测硅表面的重建（111）。通过训练来自14，000个小Si体和表面超晶胞的DFT原子构型的力场，他们显着扩大了分子动力学模拟的长度尺度（17，000个原子）和时间尺度（约几纳秒）。从这个模拟中，作者发现一个可能的步骤介导的原子爆炸过程可以引发大规模的非保守原子重排。此外，他们还发现空位的集体扩散是重构的关键过程. 图9显示了这种空位扩散过程。这两个报告107，132表明MLFF的力量不仅在于直接预测性质，而且还在于预测动力学过程。半导体制造正如前一部分所提到的，ML在半导体中的应用并不局限于材料科学。半导体制造过程的自动化和优化，甚至是器件生产的自动化和优化，近年来引起了许多研究兴趣年在本小节中，我们将讨论用于半导体制造的ML，包括晶圆检测、工艺优化、故障检测和器件生产。晶圆生产是各种芯片的基础因此，晶圆的良率与品质对于半导体制造业是极为重要晶圆检测作为一个核心过程，可以评估晶圆的质量，并帮助提高晶圆的质量。许多ML研究都集中在晶圆检测上50，54，56，74，100，102，103，133。Cheon等人55提出了一种自动缺陷分类（ADC）系统来识别和分类晶片表面缺陷。该系统的输入是扫描电子显微镜图像。通过使用卷积神经网络（CNN）模型，该系统可以在几乎不需要人工干预的情况下完成检测，实验证明该方法具有较高的性能。图10a示出了这种ADC方法的CNN架构，图10b示出了3D自动编码器输出空间中缺陷类型的分布。Imoto等人提出了一种基于神经网络的迁移学习方法用于晶片缺陷101的分类，该方法可以降低ML计算成本。在对大量训练数据进行弱监督预训练后，ML模型只需要对不同任务的小训练数据进行微调虽然计算量减少了近2/ 3，但该方法仍能以较高的精度对缺陷图像进行Kim等人75研究了人工神经网络（ANN）、DT和K-最近邻（KNN）三种算法中无关变量对晶圆检测ML模型他们为每个算法建立了四个模型：分类任务的高复杂度和低复杂度模型，以及来自两个不同设备的两个数据集（EQ 1和EQ 2）的回归任务的高复杂度和低复杂度模型回归任务预测每个晶片的图图10 c-f绘制每个预测模型的相对曲线下面积（AUC）对人工无关变量的数量。可以得出结论，无关变量对每个预测模型的预测精度都有负面影响，DT算法对无关变量最不敏感晶圆的良率是晶圆制造的另一个重要问题。已经提出了许多ML方法来优化该过程，这些方法的目的是提高产率和质量 49 ，51Singgih等人57试图优化所有制造机器的时间他们在Anylogic软件环境中开发了数据收集方案和测试平台。通过应用四种ML算法（自适应提升，梯度提升，RF，DT），模型的准确性可以分别提高到97.88%，97.88%，97.88%和97.82%Kim等人96不仅关注晶片产率，而且关注可生产性，即，投资回报率（ROI）。本文以晶圆的尺寸、成本和销售价格为优化因素，以投资回报率为优化目标。通过使用DNN和差分进化（DE）算法，晶圆生产率提高了7.96%。如果晶圆通过/失败测试不准确，则整个测试过程将不准确。制造业将受到严重打击。一些研究人员试图使用ML方法来预测和减少过程故障15，16。为了自动评估17提出了一种基于深度信念网络（DBN）的多分类器。该方法能够自动采集过程中传感器的信号，并对故障检测进行预测.这种多分类器在半导体制造过程中表现出很高的性能Lee等人104试图在可能发生工艺故障时定位引起晶片故障的传感器信号。他们提出了一种名为FDC-CNN的CNN模型，用于半导体制造过程的故障检测和分类（FDC）该分类器不仅接收多变量传感器信号，而且沿时间轴滑动.它的设计是为了欺骗-审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，10003310月16图8| a，模拟晶格常数与实验的比较。b.温度的幂律。c，不同温度下概率分布的三维极坐标图。d，通过MLFF获得的三相的示意图转载请注明出处。一百零七© 2019美国物理学会。图9|硅表面的空位扩散（111）。黑色圆圈表示原始空位位置，黑色箭头表示空位扩散方向，绿色箭头表示与空位交换后表面原子弛豫到新位置。转载请注明出处。132.© 2021美国物理学会。(For对本图图例中所指颜色的解释，读者可参考本文的网络版。）考虑到数据的结构特征，第一卷积层具有原始数据的结构含义，使得能够定位表示过程故障的变量和时间信息。图10 g示出了FDC-CNN的特征提取层，以及 10 h表明FDC-CNN的训练速度比其他ML模型快得多。除了晶圆制造之外，还有许多关于ML研究的研究工作集中在半导体器件生产108，134例如，Acharyya et al.109提出了一个单一的化学电阻金属氧化物气体传感器，用于识别多种气体和挥发性有机化合物（VOC）准确地采用高灵敏度的微结构和ML工具。在尝试了几种ML算法后，他们发现这种传感器和方法能够准确地分类/识别测试VOC，并具有良好的量化效果。另一个例子是电子皮肤（e-skin）。Niu等人7提出了一种人工智能（AI）驱动的全皮肤仿生（FSB）电子皮肤，由人类毫毛和表皮的结构组成真皮层通过将其与六层人工神经网络相结合，他们开发了一种超越人类能力的先进智能材料认知系统图11示出了该电子皮肤如何模仿生物系统及其详细结构。总结与展望本文介绍了ML在半导体材料科学和半导体制造领域的一些进展。由于学术水平和学科的限制，许多其他相关的高质量的研究还没有很好地介绍，如半导体晶体生长的动力学模拟92-审查DOI：芯片|Vol 1|冬季2022刘，D.-Y. 等人芯片1，10003311月16图10|用于晶圆缺陷检测和制造过程的一些ML模型。a，用于ADC方法的CNN架构55。b，3D自动编码器输出空间55中的图像特征向量和缺陷类型。转载请注明出处。五十五© 2019年美国电气与电子工程师协会。c，EQ1数据分类任务中无关变量对预测性能的影响75。d，除EQ2数据75的分类任务外，与面板c相同。e，除了EQ1数据75的回归任务外，与面板c相同。f，除EQ2数据回归任务75外，与面板c相同。转载请注明出处。七十五。© 2019 MDPI. g，FDC-CNN中的特征提取（前几层）104。FDC-CNN和其他ML模型之间的训练速度比较。转载请注明出处。104.© 2017 IEEE.opment. ML方法已经帮助半导体领域的研究人员在计算模拟和制造方面取得了巨大的进步。尽管ML在半导体领域的应用已经取得了一些成果，但仍有一些不足之处如前所述，ML是一种统计机器学习。一些不足之处源于统计分析的不足：（1）材料科学和半导体制造业中有大量的数据，但有时仍然不足以建立通用模型，或者在某些研究中没有正确使用。模型越通用，学

下载后可阅读完整内容，剩余1页未读，立即下载