高能物理粒子传输的快速模拟方法研究

166 浏览量更新于2023-12-04 收藏 1.3MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

用于高能物理量热计模拟的弗洛里安·维姆1，2，索菲亚·维莱科萨1，克尔斯廷·博拉2，3，德克·克鲁克尔31CERN，瑞士2德国亚琛工业大学2德国DESY2florian.matthias. cern.ch摘要在粒子物理学中，模拟粒子通过探测器的传输这一挑战促使人们研究不同的、更快的方法来取代标准的蒙特卡罗模拟。深度学习生成对抗网络是最有前途的替代方案之一。以前的研究表明，他们达到了必要的精度水平，同时减少了模拟时间的数量级。在本文中，我们提出了一种新开发的神经网络架构，它采用2D卷积层再现了三维问题，并将其性能与早期的3D卷积层架构进行了比较。性能评估依赖于直接比较，森蒙特卡罗模拟，在不同的物理量通常用于量化检测器的响应。我们证明了我们的新神经网络架构在3D卷积GAN方面达到了更高的准确度热量计是模拟时间最昂贵的探测器之一因此，我们把我们的研究重点放在一个有规则的高度椭圆形的几何结构，作为未来的量热计的一个例子反旋磁量热计原型介绍今天，粒子探测器使用基于蒙特卡罗的方法来模拟，例如Geant4工具包（Agostinelli等人，2003）。由于复杂的探测器几何结构和多种多样的物理过程，蒙特卡罗模拟的计算成本很高，目前需要全球大型强子对撞机（LHC ）网格资源的一半以上（Albrecht等人，2019）。在LHC（HL-LHC）未来的高亮度阶段，预计模拟数据将增加约100倍（Apollinari等人，2017）。即使考虑到技术改进，这也将大大超过HL-LHC制度的预期计算为了克服这一障碍，正在进行深入研究，以开发更快的标准替代品版权所有© 2021，本文由作者所有。根据知识共享许可协议署名4.0国际（CC BY 4.0）允许使用蒙特卡罗模拟寻找更快的模拟方法的主要困难是所需的高精度。基于深度生成模型，几个原型通过实现与传统模拟相似的准确度而展示了巨大的潜力（ deOliveira等人，2017; Paganini等人，2018; Ghosh 2019;DiSipio等人，2019; Chekalina等人，2019）。生成对抗网络（GAN）代表了此类模型的一个例子：到目前为止，它们主要用于模拟热量计（ Carminati et al.2018）。在本文中，我们描述了一种新的GAN架构，该架构使用二维卷积层（Conv2D）来生成电磁量热计的三维体积。我们将我们的架构与为相同检测器用例开发的复杂三维卷积（Conv3D）GAN结果进行了比较，相应的蒙特卡罗模拟的多个物理验证指标。Conv2D模型提高了物理精度，同时减少了计算时间。在下文中，我们提供了相关工作的回顾，随后简要描述了电磁量热计和训练数据集。接下来，我们介绍我们的Conv2D原型，并从物理精度和计算时间方面评估其性能最后一部分总结了本文的结论和对未来工作的展望。相关工作GAN属于生成模型组，现在用于各种不同的任务（Alqah- tani 2019）。整个GAN模型由两个深度神经网络组成：生成器网络，其从由随机数组成的潜在向量生成图像;以及训练器，其被训练以评估和区分生成器的生成图像与训练或验证图像。GAN是最有前途的方法之一，它正在成功地取代传统的Monte Carlo来模拟探测器，特别是量热计。几项研究表明，GAN实现了与Monte Carlo相似的精度水平，同时大大减少了模拟时间（Carmi- nati et al.2018）（Khattak et al.2019）（Erdmann et al.2019年）。在这项研究中，我们将我们的结果与为相同目的图1：卷积3D生成器神经网络架构（Carminati et al.2018年）。输入是一个潜在的矢量，输出是三维淋浴图像。热量计原型。该模型可在GitHub上获得（Vallecorsa etal. 2020），其生成器架构如图1所示，以供参考。该模型在（Carminati et al.2018年）大幅加速（单个电子的模拟时间为4ms，相比之下，在英特尔至强处理器上使用Geant 4的模拟时间为17 s），同时在物理方面与Monte Carlo达成了良好的一致（Carminati等人，2018年）。2018年）。（Quast 2020）使用不同的Conv2D网络架构来模拟三维热量计簇射图像。这是通过生成12个二维15x7图像并将其叠加为3D图像来实现的。在我们的研究中，我们测试了一个类似的架构，基于堆叠一组二维图像，每个图像代表一个热量计层。然而，就我们在本研究中建议的模型而言，这种方法在物理和速度方面导致了更差的性能。电磁热量计通过测量粒子能量，量热计是高能物理实验的核心组成部分之一（Brown和Cockerill 2012）。初级粒子进入量热计的材料并与之相互作用，并在通过检测器时通过产生次级粒子来储存能量。次级粒子又通过导致簇射产生的相同机制产生其他粒子当簇射发展时，粒子的能量随着其被热量计传感器吸收或测量而逐渐减小在我们的工作中，我们模拟了电磁量热计，它是专门设计来测量通过电磁相互作用（主要是电子的韧致辐射和光子的对产生）在检测器体积中相互作用的电子，正电子和光子的能量。如上所述，量热计代表了计算上要求最高的模拟，因此是加速模拟过程的起点通过将每个量热计传感器表示为图像中的像素并且将对应的能量测量表示为像素强度，可以将检测器输出解释为图像并且对其应用计算机视觉策略和方法。然而，应当注意的是，这样的“淋浴图像”相对于典型的RGB图像表现出重要的差异，特别是它们的高水平的稀疏性和大的像素强度动态范围，其可以跨越几个数量级。我们的训练和测试数据集包含粒子簇射im-图2：3D空间的表示（左）和y=13时的淋浴发展示例（右）。年龄记录的热量计，模拟使用Geant 4为未来的电磁热量计原型。对于我们的研究，我们使用200 000电子簇射图像的初始能量在2-500 GeV的范围内和25 x25 x25像素的三维形状。热量计结构和数据集的详细信息图2示出了在中心层（y=13）中截取的示例簇射图像，其中粒子在位置x=13、y=13和z=0处垂直于x-y平面进入量热计，簇射在z-0方向上发展。方向粒子簇射图像根据初级粒子的能量Ep进行参数化，该能量是进入量热计体积的电子的能量，量热计测得的总能量，我们在-表示为Ecal（用于电磁热量计）。Ecal和Ep之间的关系取决于量热计的类型、在神经网络中，用Conv2D层替换Conv3D层通常会降低计算复杂度因此，每个时期的计算资源和训练时间。然而，一个非平凡的策略是必要的，以结合Conv2D层，以正确地再现三维体积。我们的Conv2D生成器架构（如图3所示）使用2D卷积层和转置2D卷积（Conv2D转置）层的混合（以将图像大小增加到所需的维度）。此外，我们使用批量归一化（BatchNorm）（Ioffe等人，2015），整流线性单元（ ReLU ）和泄漏整流线性单元激活函数（LeakyReLU）的混合（Maas图3：Conv2D Generator神经网络架构。输入是一个潜在的矢量，输出是三维淋浴图像。2013 年），以考虑图像稀疏性，和 dropout 层（Dropout）（Nitish等人，2014年），以防止模式崩溃。卷积层被组织在三个分支中，以便使模型能够沿着三个规范图像维度正确地学习像素级相关性。三维图像，25x25x25使用以下命令生成和参数化（条件化）形状输入粒子能量Ep。我们用于模型的超参数、学习率和学习率衰减是通过使用Optuna工具进行超参数搜索而找到的（Akiba et al. 2019年）。比较Conv3D和Conv2D生成器的参数总数（表1），可以注意到Conv2D模型的参数数量是Conv3D模型的两倍多。此外，表1显示Conv3D网络的大部分参数（630k）位于第一个密集层。这种选择可能代表了Conv3D模型在表示能力方面的局限性。另一方面，Conv2D模型在稠密层中仅包含其参数的一小部分。在卷积层中具有更多参数（意味着更多的卷积层、更多的通道和/或更大的滤波器尺寸）的优点是卷积层在学习图像相关性方面表现得更好。因此，我们期望Conv2D模型具有更高的学习能力，并能够解决更复杂的任务。架构差异对训练和推理时间有直接影响。我们通过运行20个预热步骤，然后运行100个推断步骤（每个步骤中包括20个批次），对推断过程进行基准测试。如表1所示，尽管参数数量较多，但Conv2D推理时间要短得多。 Conv2D模型在训练时间方面也更快：每个epoch只有105 s ，而不是 Conv3D的291 s 。所有 GAN 运行均在NVIDIA Tesla V100-SXM 2 GPU 上执行，使用TensorFlow 2.0版、CUDA 10.2版和128个批次大小。遗憾的是，Geant 4目前并不完全支持GPU架构，其模拟时间是在英特尔至强处理器上测量2018年）。表1：Conv2D和Conv3D生成器网络的参数总数以及第一密集层内的参数数量。GPU上的推理时间以及与MonteCarlo相比的相应速度。模型总密集推理加快Conv2d2.05M0.12M5.4秒8 000xConv3D0.87M0.63M7.0秒6 200x评价在本节中，我们评估了我们的新Conv2D模型与Conv3D模型的性能（Carminati et al.2018）和蒙特卡罗方法（Geant 4）。生成模型的性能评估仍然是一项艰巨的任务，根据具体的应用，已经提出了几种方法（Borji 2018）。为了评估物理性质，我们测量了热量计体积上的能量模式，重点是通常用于表征热量计特性的特定量。首先，我们建立了粒子簇射形状沿y-和z-轴为20 000个样本的能量范围内的2- 500 GeV。沿x轴的簇射发展与y轴相似，因此未示出.这些簇射形状在图4（左）中以线性能量轴标度和（右）以对数标度示出。GAN分布与预期的Monte Carlo值一致，不确定性特别是，之前的研究表明模拟体积边缘（沿x轴和 y 轴的第一个和最后一个单元格）的性能较差（Khattak等人，2019）。在图4中，我们可以看到，当能量沉积在敏感体积的边缘变得非常小时，两种GAN模型的性能都然而，总体Kolmogorov-Smirnov（双样本）检验（KS-2008）对于大多数分布和初级粒子能量产生的概率高于80%。为了简化训练和超参数调整期间的评估，我们基于上述2D簇射形状构建均方误差±∈··图4：粒子簇射沿y轴和z轴的分布，线性能量轴刻度（左）和对数刻度（右）。GAN分布与Monte Carlo我们测量的Conv2D模型的MSE为0.044，Conv3D模型的MSE为0.065，表明准确性更好（MSE越低越好），与图4中簇射形状图的结果一致。图5中示出了采样分数，其为总测量能量Ecal和初始粒子能量Ep之间的关系。它代表了发电机网络在整个能量范围内的能量响应。我们可以看到Conv2D模型与Geant 4保持完全一致，整个能量范围内，而Conv3D模型表现形式更差的Ep能量低于100 GeV。对于热量计模拟，重要的是，细胞能量响应被GAN模型正确地再现。图6显示了20000个簇射的单电池能量沉积，输入能量在2- 500 GeV范围内。GAN的描述是不准确的，特别是对于小于1MeV的小小区能量沉积额外重新-为了改进协议，需要进行搜索不过，应该指出的是，我们只使用了最小的能量阈值为10−6GeV，探测器能量分辨率为考虑到。图7和图8比较了GAN和Monte Carlo中单细胞能量分布输入能量Ep=250 2的1580个GeV。为了简单起见，我们将重点放在构成能量簇射的核心，在那里发生更大的能量沉积，我们分析了坐标为x，y，z的单元[10，16]，总共有777= 343个单元。预期比率=1在两个图中被绘制为红线，用于比较。图5：在整个能量范围内比较Conv3D和Conv2D对Geant4的响应的图7示出了对于Conv2D模型，每个单元的平均能量沉积非常接近Geant 4，它们的比率平均为1。00. 另一方面，Conv3D模型稍微低估了相对于Geant 4的平均细胞能量沉积，平均比率接近0。93. 类似地，图8显示了单细胞能量分布标准偏差（STD）方面的GAN/Geant 4比率，我们将其用作单细胞能量分辨率的代理。虽然这两个模型都低估了这个数量，但Conv2D架构显示的值更接近蒙特卡洛预测，平均比率约为0。90对0 86ob-−图6：细胞能量沉积的直方图。图7：单个单元（像素）能量分布平均值。 Conv2D模型的总体平均值为1。00，Conv3D模型的总体平均值为0。93.图8：单个单元（像素）能量标准偏差。 Conv2D模型的总体标准差为0。90，Conv3D模型的总体标准差为0。86岁。为Conv3D。此外，还值得进一步研究，看看阵雨的尾部，以证明协议的水平最初的GAN论文（Goodfellow et al. 2014）表明，如果给定足够大的网络、训练样本和计算时间，GAN可以学习任何目标分布。然而，在（Arora et al.2017）表明，即使生成的离散度远离目标分布，训练目标也可以接近其最优值此外，GAN模型存在众所周知的问题，例如模式下降或模式崩溃（Yazici et al. 2020），这会影响生成样本的质量。了解GAN是否可以重现原始Monte Carlo数据集所表现出的相同相似性水平，在科学模拟的背景下至关重要。为了更好地理解图像之间的相似性/多样性水平，我们测量了结构相似性指数（SSIM）（Kumar et al.2013年）。SSIM估计相似图像之间的感知差异，值1表示两个相同的图像。SSIM由参数L调整，该参数考虑像素强度动态范围，并在L= 10−4时稳定。我们计算SSIM在图像内构建2D窗口，并将它们滑过热量计xy平面，而z轴被视为图像通道维度。我们从蒙特卡洛数据（标记为 “MC vs MC” ）、 GAN 数据（ “GAN vsGAN”）或两个集合（“MC vs GAN”）中测量随机图像对的索引。图9显示了L= 10−4时的计算结果。在-所有，我们观察到，生成的图像与SSIM。根，代，代两个GAN模型的标准化图像明显高于相应的Monte Carlo值，这表明，平均而言，GAN图像比Monte Carlo图像彼此更相似或者换句话说，GAN无法再现Monte Carlo样本中存在的图像多样性然而，Conv2D模型在SSIM较低的情况下表现更好（图9中的同样有趣的是-值得注意的是，通过测量GAN之间的相似性，和蒙特卡罗图像（浅蓝色和灰色），我们可以得出结论，这两个GAN模型产生的图像类似于蒙特卡罗图9：不同图像集之间的SSIM虽然我们计划继续研究，以便更好地量化GAN在支持空间大小、样本多样性和模式丢弃效应方面的性能，但目前的结果完全在快速仿真模型所需的精度范围内。对于单细胞能量观察到最大的差异，如图6所示，我们可以通过调整初始图像预处理步骤来调整。结论和今后的工作本文介绍了一种用于模拟高能物理量热计探测器输出的新型 Conv2D 神经网络结构。我们将 Conv2D 与先前的Conv3D模型进行了比较，并对Monte Carlo模拟结果进行了验证。结果评估是根据几个物理量，如能量分辨率，簇射形状或采样分数和图像分析度量，作为SSIM。综合考虑，Conv2D模型与Monte Carlo模拟的一致性非常令人满意与此同时，SSIM指数暗示了生成的图像之间的多样性稍微有限。一个完整的特征的conse-需要相对于典型的模拟数据集用例的这种差异的序列再加上详细的研究，以了解图像相似性是否可以与生成的数据中的任何特定偏差相关在计算方面，尽管Conv2D模型中的参数数量较多，但我们在推理和训练时间方面都获得了显着的速度。确认这项工作得到了德国联邦教育和研究部 WolfgangGentner计划的引用2008. New York，NY：Springer New York.ISBN 978-0-387-32833-1。Agostinelli; et al. 2003. GEANT 4-一个仿真工具包。核仪器Meth. A 506：250-303。Akiba ， T.; Sano ， S.; Yanase ， T.; Ohta ， T.; 和Koyama，M. 2019. Optuna：下一代超参数优化框架。Albrecht; et al. 2019. 2020年代HEP软件和计算研发路线图。大科学计算与软件3. doi ：10.1007/s41781-019-0031-6。阿尔加赫塔尼角a. 2019.生成式对抗网络（GANs）的应用：最新评论。工程计算方法档案。Apollinari;等.2017年。高亮度大型强子对撞机（HL-LHC）：技术设计报告V。0.14/2017。Arora; 等 .2017 年。 Generative Adversarial Nets（GANs）中的泛化和均衡Borji，A. 2018. GAN评估措施的优缺点。Brown，R.;和Cockerill，D. 2012.电磁量热法物理研究中的核仪器和方法A部分：加速器，光谱仪，探测器和相关设备666：47Carminati;等.2018年用于快速模拟的三维生成式广告网络物理学杂志1085：032016。Chekalina; et al. 2019.快速量热计模拟的生成模型：LHCb案例。EPJ Web of Conference214：02034.de Oliveira;等.2017年。通过示例学习粒子物理学：用于物理合成的位置感知生成对抗网络。大科学计算与软件1（1）。DiSipio; et al. 2019. DijetGAN：一个生成对抗网络方法，用于在LHC。高能物理学报2019（8）.Erdmann; et al. 2019. 使用Wasserstein生成对抗网络精确模拟电磁量热计簇射。3.第三章.戈什A. 2019. ATLAS中快速簇射模拟的深度生成模型。技术报告，欧洲核子研究组织，日内瓦。Goodfellow; et al. 2014. 生成性对抗网络。Ioffe;等.2015年。批量归一化：通过减少内部协变量偏移来加速深度网络训练。Khattak; et al. 2019.粒子检测器模拟使用生成对抗网络与领域相关的约束。2019年第18届IEEE机器学习与应用国际会议（ICMLA）。Kumar;等.2013年。压缩医学图像的改进SSIM质量指标的开发251-255. doi：10. 1109/ICIIP.2013.6707593。Maas，A.L. 2013年。整流器非线性改善神经网络声学模型。Nitish;等.2014年。Dropout：一种防止神经网络过拟合的简单方法 Journal of Machine Learning Research15（56）：1929Paganini;等.2018年CaloGAN：使用生成对抗网络模拟多层电磁量热器中的3D高能物理评论D97（1）。Quast，T.2020年。CMS热量计端盖升级236的光束测试热量计原型的鉴定、性能验证和快速生成建模Vallecorsa;等.2020年。3Dganhttps://github.com/svalleco/3Dgan/tree/master/keras.Yazici，Y.; Foo，C.- S.的;温克勒，S.;是的，K.- H.的;和Chandrasekhar，V.2020年。GAN训练中过拟合和模式下降的实证分析

下载后可阅读完整内容，剩余1页未读，立即下载