软MIMO检测的物理启发式算法在5G新无线电和其他无线电中的应用

196 浏览量更新于2024-02-04 收藏 2.73MB PDF 举报

大规模MIMO系统

5G网络

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

42××××→×用于5G新无线电及其他无线电中的软MIMO检测的物理启发式启发式算法Minsung Kim★，<$，Zhao，Salvatore Mandrà<$，Zhao，DavideVenturelli，Kyle Jamieson★普林斯顿大学★、NASA艾姆斯研究中心、QuAIL†、USRA高级计算机科学研究所、KBR公司。⊤摘要克服吞吐量和误码率（BER）性能与计算复杂度之间的传统权衡是蜂窝5G新无线电路线图以及下一代无线局域网的基站设计中上行链路多输入多输出（MIMO）检测在这项工作中，我们提出了ParaMax，这是一种MIMO检测器架构，首次在此类问题上采用物理启发的并行回火算法技术[28，50，67]。ParaMax可以在大型MIMO系统中实现接近最佳的最大似然（ML）吞吐量性能，大规模MIMO系统中，基站具有额外的RF链，以接近基站天线的数量，以便支持甚至更多的并行空间流。ParaMax能够实现接近ML-BER性能高达160 160和80 80大MIMO的低阶调制，如BPSK和QPSK，分别只需要不到几十个处理元件。关于大规模MIMO系统，在SNR为16dB的16-QAM的1224MIMO中，ParaMax实现了330 Mbits/s的接近最佳的系统吞吐量，每个子载波有4-8个处理单元，大约为1。4吞吐量比基于线性检测器的Massive MIMO系统。CCS概念• 网络无线接入点、基站和基础设施。关键词并行回火，大规模MIMO，MU-MIMO检测，5GACM参考格式：Minsung Kim ， Salvatore Mandrà ， Davide Venturelli ， KyleJamieson.2021年5G新无线电及其他领域软MIMO检测的物理启发式启发式算法。在第27届移动计算和网络国际年会（ACM WEBCOM '21）上，2021年10月25日至29日，美国路易斯安那州新奥尔良。ACM，纽约州纽约市，美国，14页。https://doi.org/10.1145/3447993的网站上下载。34486191引言多用户多输入多输出（MU-MIMO）已被证明是在许多不同类型的无线系统（如802.11无线LAN和5G新无线电蜂窝网络）中最大化容量的基本技术。在MU-MIMO中，上行链路接收机（即，无线LAN中的接入点（AP）或蜂窝网络中的基站（BS）。ACM承认此贡献是由美国政府的雇员、承包商或附属机构撰写或共同撰写的因此，美国政府保留非排他性的、免版税的权利，可以发布或复制这篇文章，或者允许其他人这样做，仅供政府使用。2021年10月25日至29日，美国路易斯安那州新奥尔良市，©2021计算机协会ACM ISBN 978-1-4503-8342-4/21/10。. . 15美元https://doi.org/10.1145/3447993.3448619图1：5G新无线电和下一代局域网中的基本MIMO机制，以及各种检测方法的近似可行性。网络）通过在并行流上对数据进行条带化（一种称为空间复用的技术）来同时支持许多用户，并且因此能够实现显著更高的数据容量。在理想情况下，MU-MIMO可以支持的并行流的数量将是移动用户的数量和基站处的无线电设备的数量中的较小者，并且总体系统容量将与空间流的数量成比例地增加。然而，在实践中，通道硬化现象以下述方式使这种情况复杂化MU-MIMO需要信号处理来将空间流彼此分离，这是一种称为MIMO检测的技术。对于具有与无线电前端一样多的天线的基站，当用户的数量接近基站天线的数量时，MIMO检测变得极其困难，导致传统线性检测算法的性能差[76]：这是大MIMO机制其位于用户数量等于基站天线数量的点上，如图1所示。1对于大型MIMO，存在最大似然（ML）精确解算器，其可以实现最低可能的误码率，并且因此恢复高吞吐量。不幸的是，这些检测算法的代价是随着MIMO大小的增加，所需的计算资源呈指数级增加，最终将是：由于无线系统中的处理时间限制，这对于许多用户来说是不可行的例如，对于4GLTE上行链路和下行链路两者，BS的计算的最多三毫秒是可用的[15，76]。大规模MIMO系统，如LuMaMi和Lund（6-12个用户，100-128个BS天线）[44，59，69]，Argos（8个用户，96个BS天线），nas）[62，64]、BigStation [76]、Agora [18]和三星1为简单起见，我们称��大规模MIMO机制为“大MIMO”，��当MIMO = 1时为“大MIMO”，而当MIMO =1时为“大规模MIMO”，无论MIMO大小如何�� <�� 43/≫×≥≥××××..{···}∈2021年10月25日至29日，美国路易斯安那州新奥尔良市，ACM第21届世界计算机大会用下面的方式。由于当无线信道条件良好时，诸如迫零（ZF）和最小均方误差（MMSE）之类的线性检测器可以实现接近ML的性能，因此使用比用户/空间流多得多的基站天线的系统（即，对于MIMO）可以向每个基站无线电提供从多个天线中选择一个天线来使用。这在很大程度上抵消了信道硬化的影响，但需要基站天线的数量比用户大足够多（例如，对于16个用户为10[8]或4个或以下[62]，而没有证明的经验法则最大化频谱效率[8]），如图1所示，以实现空间流的全吞吐量。此外，从实际的角度来看，部署大量天线最终会变得具有挑战性，在无线局域网中最严重，但在小型密集部署的5G基站中也是如此，其中形状因素排除了过多数量的天线，并且最终在塔尺寸实际上受到限制的普通基站中。在本文中，我们采取了一种互补的方法，大规模MIMO：我们开始与一个特定的大规模MIMO配置，其中基站天线的数量几乎是在其最大值，然后问的问题，如何可以通过额外的空间流进一步提高性能？答案在于前面两个想法的融合：在Massive MIMO基站上添加无线电链，以等于天线的数量，同时利用近ML检测算法。这将我们推向图1中空间的右上角，并使计算复杂度最大化，但考虑到我们对基站天线数量的实际限制，仍然可以提供最大的空间复用增益。转向物理学启发的方法。在过去的几年里，人们对替代计算方法产生了浓厚的兴趣，这些方法通过将优化收敛与物理原理联系起来的杠杆算法来降低当前检测器的复杂性。鉴于这些方法的硬件本地实现的实验性举措，这种兴趣正在进一步加速，使用量子和经典物理计算[4，13，24，25，36，38，39]。这些算法的一个共同点是，它们将计算问题框定为磁自旋系统的能量最小化问题，也称为伊辛自旋模型[32]。除了作为理解磁系统背后的物理学的重要模型之外，任何NP计算问题都可以表示为适当的伊辛自旋模型的能量最小化[43]（即，伊辛自旋模型是NP完全的[74]）。在这方面，物理启发的算法可以被看作是参数化的“黑匣子”，其接受伊辛自旋问题作为输入，并输出具有最低关联能量的配置。一种算法与另一种算法的区别在于用于找到全局最小值的基本机制，其对应于MIMO检测中的ML最优解。本文介绍了ParaMax的设计和实现，ParaMax是一种用于大型和大规模MIMO网络的软MU-MIMO检测器系统，它使用并行回火，这是一种物理启发式算法，图2：ParaMax可行的MIMO方案总结（参见图1）和每副载波所需的处理元件计数��PE。对于MIMO检测，作为完全经典的算法实现，不需要任何特定的硬件，并将其集成到我们的系统的整体设计中（§4.2）。我们还引入了一种新的算法（§4.2.2）来为启发式检测器生成软信息，从而实现更可靠的检测和解码。该算法利用启发式检测输出，并产生软信息，定义为逐位检测置信度，直接考虑到信道条件和噪声。据我们所知，这是第一次将并行调制应用于无线网络，ParaMax是第一个基于并行调制的MIMO检测器，它成功地证明了超大型和大规模MIMO的近ML性能。实验结果表明，ParaMax算法的性能随着处理单元数目的增加而不断提高。在低阶BPSK和QPSK调制的情况下，分别为160160和80 80的非常大的MIMO可以在少于几十个处理元件的情况下实现接近ML的性能，如图2所示。关于大规模MIMO系统，在1224 MIMO采用16-QAM调制，SNR为16 dB，ParaMax实现了330 Mbits/s的接近最佳的系统吞吐量，每个子载波有4-8个处理单元（PE），约为1. 4比基于线性检测器的Massive MIMO系统更好的吞吐量。2背景本节介绍背景知识，指出相关文献。第2.1节和第2.2节分别解释了ParaMax的算法基础、模拟退火和并行回火。第2.3节描述了MU-MIMO模型和检测问题。2.1模拟退火模拟退火（SA）是一种经典的启发式优化技术，通常用于寻找伊辛自旋问题中能量最低的状态或构型s，其中s是由1，2，、自旋，每个自旋都假定值为{-1，+1}。一般来说，伊辛自旋探测器的能量目标函数lems（也称为哈密尔顿算子）被表示为以下形式的二次H（s）= + ，（1）并行处理任何数量的可用处理器，支持固定延迟和高度可扩展的并行性。我们设计了ParaMax Ising求解器（§4.1），这是一个基于并行回火的求解器，其中，R1是（反）铁磁耦合，其指示两个自旋之间的相关性的R2=R3或R3 = R4），并且�� ∈ R局部磁场单独作用于��= ±1。任何tic算法，在经典平台上。ParaMax在以下领域灵活运作44（）下一页（）下一页（）下一页（[]）−H（）/ZZZ/H∈O|O||O|O∈ ∈ O∈∈+ ≤×≤≤H⊆O⊂D（）−检测的概率它被定义为v= argminy−H v2。（（5G新无线电和超越5G新无线电的软MIMO检测的物理启发式启发式算法ACM优化问题，包括MIMO检测，理论上可以通过适当选择{}和{ }转换为伊辛自旋模型[43，74]。模拟退火（SA）启发式。SA受到退火的物理过程的启发，其中金属材料从高温缓慢冷却，最终达到材料势能最小化的分子状态或原子构型。SA数值模拟这一过程，以找到全球最佳（或基态）的方程。1.一、为了实现SA，有必要模拟一个热浴，它模仿与伊辛自旋模型相互作用的冷却或退火过程。更准确地说，在给定的逆温度= 1下，伊辛自旋系统探测给定自旋组态s的概率遵循吉布斯分布 s =exp s，通常称为配分函数[12，21]。随着温度降低，找到能量大于最小能量的状态s的概率s呈指数下降。因此，从低温吉布斯分布采样允许以高概率快速检测具有最低能量的自旋构型。然而，配分函数的计算，从而�� 在计算上是有挑战性的，特别是对于低温。为了避免吉布斯分布的直接计算，Metropoliset al.��[50]提出使用马尔可夫链过程来帮助系统模拟给定温度下的退火和启发式探索具体来说，他们提出了一个随机过程来“翻转”自旋，概率仅取决于温度和哈密顿量。（但不包括Z），即：其中Δε和Δ分别是两个复制品的温度倒数差和能量差如可以看到的，如果处于较高温度的副本具有比具有较低温度的副本更低的能量，则两个温度总是交换的否则，两个温度的交换根据等式2被接受或拒绝3.第三章。在各种困难的优化问题中，并行回火大大加快了自旋系统的热化[37，68，78]，包括量子退火机的基准[45-47]。2.3MIMO检测空间复用MIMO系统（OFDM系统中的每个子载波[54]）的输入和输出关系在用户侧具有多个输入��在 ��接收器侧具有 ��无线电（ �� ）的输出天线（）被描述为y= Hv<$n。与�� （i。例如，��具有��无线电流的MIMO），这里yC��是由加性高斯白噪声（AWGN）nC��，HC��×�� 是无线信道，v′�� 是具有星座的符号的发送集合��（例如，4-，16-，64-QAM），表示��每个信道使用= ��log 2比特，具有调制的大小。在接收器侧（AP或BS）处的MIMO检测是一种用于找到候选解决方案的技术��其目的是检测发送的符号向量（即，，目标是基于接收信号y和估计H。导频符号使得能够估计H。最大可能检测。最大似然检测(ML检测）是最佳的，因为它使误差最小化其中Δ是对于给定的初始构型，一旦自旋��（）翻转，能量的变化。因此，最终会降低自旋系统总能量的移动总是可以接受的。否则，这种自旋翻转有可能被接受或拒绝。Metropolis等人表明，如果方程中的排斥规则，自旋系统将最终热化到相应的温度2（也称为Metropolis更新或扫描）迭代应用。因此，原则上有可能找到最低能量的自旋构型，从而找到原始问题的解决方案，方法是从一个非常大的温度开始，然后通过迭代地应用方程2中的规则来缓慢地降低它二、2.2并行回火SA保证，如果温度降低得足够慢，自旋系统最终将找到最低能量的自旋构型。然而，对于困难的优化问题，它可能需要指数级长的时间。事实上，崎岖的能量景观将自旋系统“捕获”在难以逃脱的局部极小值中：平行回火[67]有助于自旋系统逃离局部极小值，因此在低温下更快地热化。平行回火的基本原理很简单：不同的复制品被平行模拟，而不是单个旋转系统，每个复制品具有不同的温度。在Metropolis更新一定量后，两个副本��1和��2的温度按照更新规则交换：��（ 1个参与者��2）=最小值。1，Δ ΔH，（3）v∈O��v的搜索集（即搜索空间S ��）是优化器可以考虑的可能解的集合。搜索空间中的每个元素v是候选解，利用该候选解，等式2中的ML目标函数v=yHv2的值被确定。4（即欧几里德距离）进行测量并相互比较具有最小值的最佳候选者成为ML解决方案v。此外，S是完整性的指标。原则上，ML搜索涉及所有可能的候选者（即，，S=π），这使得蛮力方法对于具有高阶调制的大MIMO尺寸是难以处理的。��球体解码器。球体解码器（SD）通过以顺序方式应用自适应搜索约束，即使在S的情况下也实现了最佳性能[3，17，20，70]。 SD转换Eq. 4转化为一个等价的树搜索，并应用树修剪，visiting较少的节点和叶子，而不损失最优性。然而，由于它是一个精确的算法（即，，实现ML性能），在最坏情况下，SD的搜索空间仍然呈指数级大[27]。此外，由于其顺序性质，其过程不能完全并行化，并且复杂度（延迟）在每次检测时变化，这对于硬件实现是不期望3相关工作在本节中，我们介绍MIMO检测的相关工作并行次优架构。这些方法将最优SD树搜索划分为并行任务，以便使用→− 100）=min1，��− ΔH、（二）2021年10月25日至29日，美国路易斯安那州新奥尔良市，Minsung Kim，Salvatore Mandrà，Davide Venturelli，KyleJamieson45|O|−|O|O D（）××|O|包含许多处理元件（PE）的硬件，如GPU或FPGA [31，55]，而搜索算法变得近似。对于这些方法，如固定复杂度球体解码器（FCSD）[5-7，��例如，FCSD将SD树的多个层次划分为两个独立的搜索区域，一个用于全搜索（FS），另一个用于贪婪搜索（GS）。在FS期间，FCSD访问第一��层的所有节点，然后切换到GS，其中对于剩余层仅探索具有最小部分欧几里得距离的一个子节点（子节点）。��这个探索过程可以并行进行2FCSD的结果是S由��候选解组成。这里，��是一个可控的正整数参数，它权衡了FCSD的检测性能与其计算复杂度。注意，FCSD的复杂性（即使具有小的但FCSD仍然大于线性方法，并且FCSD仅允许并行处理，例如16-QAM的16、256、4096，= 1、2、3（即，有限的复杂性，但不灵活）。ParaMax具有灵活和可扩展的并行性。MIMO检测的启发式算法。受生物学或组合优化方法启发的启发式方法，例如遗传算法，反应禁忌搜索和用于MIMO检测的粒子群优化存在[2，29，66]，但没有观察到显着的性能增益。一些研究使用了模拟量子硬件平台[38，39]，但这些是尚未普遍可用的专用平台。关于物理启发的SA，吉布斯分布和量子搜索算法的其他研究在一定程度上显示了可行性[2，9，19，22，26]，但缺乏对大型和大规模MIMO系统的全面评估以及与其他最先进检测器的比较。4设计在本节中，我们将介绍 ParaMax的设计：第 4.1 节介绍了ParaMax设计的关键构建块，即SA-paraMax回火求解器。第4.2节描述了ParaMax的完整第4.3节然后介绍了ParaMax的改进，2 R-ParaMax，它使用软信息来提高性能，但代价是一些计算复杂度。我们将在第6节中评估这两种设计。4.1ParaMax Ising求解器（PMIS）ParaMax伊辛求解器（PMIS）是Para-Max的主要求解器模块. 它基于SA，具有高度定制的并行回火算法，以优化MIMO检测的Ising模型。PMIS是一个完全经典的算法，不需要任何专门的硬件来实现。它通过更新给定随机初始配置的自旋值来执行局部搜索，根据等式二、每个副本与不同的温度相关联，并且温度可以根据等式（1）中的更新规则来交换。3.第三章。由于与每个副本相关联的能量的计算可以平凡地减少到矩阵-向量和向量-向量乘法，因此伊辛成本函数H的耦合和局部场被存储为矩阵G和向量f。分别因此，H的计算，对于更新至关重要2为了使算法的检测效果最大化在FCSD的FS阶段采用了一种信道排序策略，保证了信道较差的用户能够被检测到图3 ：PMIS 解决MIMO 检测的Metropolis Sweep分析（16-QAM，20 dB SNR）：概览（左）不同用户数量和详细视图（右）。图4 ：PMIS 解决20用户MIMO检测的温度范围分析（16-QAM，20 dB SNR）。Eq中的规则2、Eq。3，减少到：H（s）=s·[G·（s+2f）]/ 2，（5）其中s是表示自旋组态的矢量，其中因子2考虑矩阵G的对称性。在我们的实施过程中，PMIS进行了优化，以最大限度地提高性能的操作，涉及��到512个自旋变量，其中包括512，256和128单天线用户的BPSK，QPSK和16-QAM调制，分别。我们在第5节中提供了有关PMIS实施的更多详细信息。计算复杂性。在MIMO检测中，计算时间复杂度是一个基本的度量，与BER和网络吞吐量一起。从等式5，很明显，复杂度与自旋变量数的平方（=log 2）成正比。因此，回顾每个副本都是独立更新的，总体PMIS复杂度为1.2×1.2，分别表示复制副本和Metropolis扫描的数量复制品和大都会扫荡为了将计算成本降低到最低限度，我们选择了“bang-bang”并行回火方法。也就是说，只使用两个副本（ repl =2）：一个在非常低的温度下，一个在较高的温度下：较低温度下的副本作为贪婪的观察者，而较高温度下的副本作为观察者。当贪婪算法陷入局部最小值时，两个副本可以交换角色（即，温度）来解决瓶颈。虽然这已经成功地应用于量子退火[77]，但我们的研究是关于bang-bang平行回火的首次报道之一用于5G新无线电及其他无线电中的软MIMO检测的物理启发式启发式算法2021年10月25日至29日，美国路易斯安那州新奥尔良市，46按位软值（C）比特#2位#1Conf#2会议#1Ising Demapping输入：最佳Ising配置输出：MIMO检测位伊辛溶液过滤器输入：NPEIsing配置最佳Ising配置输出：最佳Ising配置（min）Nu唯一的，对应的，（）计算置信度Cj自旋检测置信度输入：NPEIsing检验输出：每个自旋变量的检测置信度C基于Ising形式的ParaMax Ising求解器NPE处理元件输入：Ising形式输出：NPEIsing转换器及相应能量伊辛#2伊辛#1H，y#2H，y#1输入：通道H，接收信号y输出：Ising形式（每通道使用）ML到Ising的减少H|O|→D（）H（）H（）×无线接收器信道H接收信号yParaMax检测算法（一）（二）-1+1旋转轴图6：1×1QPSK检测的等效表示I-Q平面中的欧氏距离D（v）（左）和伊辛能量H（s）（右）。阴影突出显示可能的解决方案。第38章我们的约定，是一样的平. 在映射中，自旋自旋表示所有可能的自旋符号（三）图5：ParaMax检测算法概述在一个经典的平台上。为了选择 Metropolis 扫描的数量（§2.1），我们根据经验检查了图3中20个实例中16-QAM的不同扫描数量（从1到80），每个实例运行10，000次PMIS毫不奇怪，我们观察到延迟（上）和采样质量（下）之间的权衡我们选择��= 50作为满足当前LTE标准的延迟要求的适当点。温度范围的选择与��repl和��sw不同，温度范围不会影响ParaMax的复杂性，因此我们选择PMIS温度范围，在该温度范围内，找到ML解决方案的概率最高（即，基态）。对于基准测试，我们选择值��min = 0。05，��max = 0。06，表现良好，如图4所示。前面的描述已经描述了单个PMIS运行。在Para-Max中，多个PMIS在多个PE上并行运行，每个PE运行一个PMIS 每个PMIS运行独立于其他运行，接受MIMO检测的Ising模型作为输入，并输出候选解决方案。4.2ParaMax设计在本节中，我们将介绍完整的ParaMax设计（图5）。我们在§4.2.1中描述了MIMO检测所需的每个模块的功能，在§4.2.2中描述了软输出生成器模块。4.2.1ParaMax检测算法。我们假设基站接收到由AWGN扰动的信号，并如第2.3节所述估计无线信道。1. ML到Ising的减少。从等式2中减少MIMO检测D（v）（=Hv-Hv）2的过程和通用公式4）利用自旋-符号映射得到伊辛形式H（s）组合（即，，log2旋转，用于每个用户的可能符号），因此其基态总是对应于ML解。2. PMIS并行处理。每个PMIS运行对独立的解决方案候选者（即，伊辛构型）。由于检测是基于启发式的，因此单个PMIS运行的解决方案可能不是最佳的，因此需要多次运行来形成一组候选解决方案，从而逐渐增加收集最佳ML解决方案的概率。由于每个PMIS优化都在一个完全独立于其他的PE上运行，ParaMax灵活地在任何数量的独立处理元件上运行（ ��），具有高度可扩展的并行性。可用处理元件��的数量等于ParaMax系统可以以完全并行方式生成的PMIS输出的数量。3. Ising解决方案过滤器和解映射。在所有 ��PMIS并行运行之后，相应的��输出被收集在伊辛自旋配置表中。在进一步处理之前，基于每个输出的伊辛能量s，将列表按解质量的顺序排序。Ising解决方案过滤器仅返回具有最佳（最小） s_i的配置s_i，其等效于无线符号v_i。例如，在适当的解映射（旋转符号）之后，用最小的v（在候选解中）。最后，将y、v转换为��MIMO检测比特。4.2.2自旋软信息输出。对于大多数基于进化论的求解器，仅返回最低能量的伊辛配置（无论它在��PMIS输出中出现多少次），并且丢弃除它之外的任何输出。然而，在ParaMax中，我们利用所有��PMIS输出来生成软信息（即，对于给定配置中的每个自旋，检测置信度通常，软输出MIMO检测器在这项工作中，我们在第4.3节中设计了前者（2 R-ParaMax）。ParaMax从独立的PMIS运行中收集候选解决方案。其中，很可能观察到多次出现某种自旋配置（具有一致的自旋变量），这可以用于识别容易（或难以）检测的自旋（即，在未知的最优ML解中很可能被分配特定值的变量）。图6示出了在两个等效表示中检测接收到的11 QPSK信号y的说明性示例Q+1个我-1在每个PE上运行软输出发生器伊辛能源-1-1-1+1+1-1+1+12021年10月25日至29日，美国路易斯安那州新奥尔良市，Minsung Kim，Salvatore Mandrà，Davide Venturelli，KyleJamieson47偶数的奇数的++−×DHHHHH–+H H−（+）−≤（+）+−≥ ≤≤HHH1Q+3+2个+1个0I值，从而估计自旋的正确性的可能性更具体地说，在收集��按伊辛能量H��（1 ≤ ��≤��）排序的PMIS输出后，系统具有��（ ��≤��）个具有对应出现计数��（1 ≤ ��≤��）的唯一输出。的自旋回波的检测置信度σ ε（1≤σ≤σε）定义为：��-1。.-3=1��1.. 你好，.��H1=1..Σ-2==��= ��·.H��.�� ·你知道吗？H��.、（六）-3-2-10+1个+2+3其中，是排名第10的事件的计数，日图7：四个伊辛自旋（变量）到第n个伊辛自旋之间的映射定量（定义见第2.1节）2），仅当配置��星座图上的用户着色第th自旋等于第一排名配置��的第th自旋（即，、表示内象限。在这个映射中，奇数自旋= 1是或零）。自旋检测置信度比偶数旋转更容易被发现距离（左）和伊辛能量（右）。在该示例中，对于大多数PMIS运行，第一自旋变量α1（对应于符号��1=1（图6中的结果为3或4，右）和 ��与自旋��2（对应于符号的虚部）相比，自旋1更容易检测。PMIS运行的多次出现一致��PMIS的结果会不一致，因为两个最常见的自旋组态��这种现象在高阶模的情况下变得更加明显由于在16-QAM或更高调制中，伊辛自旋到符号映射中的自旋系数的值跨自旋而变化，因此在16-QAM或更高调制中，自旋系数的例如，图7示出了第i个用户的16-QAM的自旋到符号映射��，其中用户�� 的可能符号与自旋43，. . . ，��4 ，即v n = 2 4 3 ��4 22 4 1四、在这里，自旋 4 3和 4 1，奇数自旋，决定了符号�� 在此，16-QAM的奇数自旋通常比偶数自旋更容易检测，因为对AWGN的鲁棒性（检测可靠性）更高。表1给出了ParaMax用于8 × 8 16-QAM检测的经验自旋方向错误率。鲁棒性的这些差异表明，使用ParaMax的软信息将特别有助于进一步处理，类似于不等错误保护（UEP）[10，30，48，72，73]）。表1：ParaMax平均自旋错误率烘箱编号的自旋：偶数编号的自旋：4月 3日4月 1日 4月2日4月3日0.167 0.1520.3290.352（0 <1. 0）是此步骤中ParaMax输出的软值注意，每个的可靠性随着所收集的输出（1）中最佳观测的伊辛能量变得更接近未知的基态（能量）而增加，这意味着随着增加，软值的质量提高。3使用量子退火引入类似的算法[35]，其中仅使用部分输出。4.32 R-ParaMax：迭代软检测我们现在介绍一种使用前一节中描述的软信息来增强ParaMax操作的我们称之为2 R-ParaMax协议。其主要思想是对PMIS块进行两次迭代，一次用于生成软置信度信息，再次基于第一次迭代的置信度获得最终检测结果第一次和第二次迭代之间的中间处理以高检测置信度对自旋进行预决策在第二轮结束时应用纠错后处理，两者都具有线性复杂度。最终结果是以适度增加的延迟为代价的更准确的MIMO检测结果，并且因此这可以用于具有挑战性的无线信道和/或大量用户。参考图5，2 R-ParaMax PMIS块的结构如图8所示。这个块替换了图5中红色标记的第三个块。其他模块与ParaMax中描述的完全相同。我们还注意到，由第二轮生成的软信息也可以用于信道解码或算法的进一步迭代。中间决策。中间预决策模块从第一轮PMIS输出中识别具有高检测置信度（超过阈值��th）的那些自旋，以便减少第二轮PMIS运行中涉及的自旋变量的数量，简化第二轮检测。也就是说，如果��第th自旋��的检测置信度th（1），则我们预先决定第th自旋变量为第一轮中最佳解的对应自旋的值（即，，1991）。在这样获得预定的自旋索引集合之后，下一个步骤是相应地更新Ising形式对于每个旋转索引，任一/两者：0.32对于每一个伊辛问题指标，我们设f′=f+f·f1，如果f��<�� and ��′ =��+��·��1，if��> ，然后删除��，��and��.软信息计算基于的等价性在I-Q和自旋配置表示中，给定自旋值的��出现计数跨越所有PMIS输出采样对应于该自旋的符号的距离3虽然ParaMax是一种固有的软输出MIMO检测器，需要简单的计算，但传统的软输出MIMO检测器需要对所有编码比特进行对数似然比（LLR）的指数复杂度的额外计算，以在信道解码器处生成软值[58，65，71]。自旋自旋用于5G新无线电及其他无线电中的软MIMO检测的物理启发式启发式算法2021年10月25日至29日，美国路易斯安那州新奥尔良市，48FHH×- -一种|F|��|/|F|/|F|F|H∀（· ）��（）下一页2 R-ParaMax PMIS模块（Compute Unified Device Architecture [60]）10.2采用GeForceRTX2080 Ti，拥有4，352个CUDA核心和68个流式多处理器。无线MIMO信道。基于模拟和跟踪驱动真实世界的无线信道用于我们的实验。在基于仿真的信道的情况下，针对各种SNR设置，合成具有AWGN的独立同分布（i.i.d）高斯信道。对于跟踪驱动的信道，我们使用2.4 GHz的非视距宽带MIMO信道跟踪，在96个基站天线（）和8个静态用户（）之间，Argos中提供的最大MU-MIMO数据集[63]。在天线数=96中，我们挑选出8到32个（以四个为一步）天线来测试最多的挑战。支持MIMO机制（例如，��≥��/4）。由于基于跟踪的通道包括测量的噪声和有限的用户数量，除非另有说明，我们使用合成大小的信道，以便精确控制SNR和评估各种MIMO机制，如SNR>8。基于图8：2 R-ParaMax PMIS模块的结构（参见图5中的第三个块为红色）。2R-ParaMax中的其他块与ParaMax中的块完全相同。其结果是一个简化的伊辛问题，其中包含��只有旋转表2总结了决定自旋的平均比率（）和预决策过程的成功率（ML）。这里， ML表示自旋的索引组，其中由预决策过程决定的自旋与ML解决方案中的对应自旋完全相同。在2 R-ParaMax中，我们应用��n≥0。97，这意味着|FM L|/|F|= 1。0（对于较低的价格，较高��适用��的标准）。用更新的伊辛形式H′（其中，��自旋），我们先用第二个PMIS产生��输出，然后过滤出最好的输出，包括��具有最小伊辛能量的自旋，’。当过滤后的配置-如果你的动作与预先决定的旋转相结合，由��自旋组成的配置可以被恢复和解映射为符号。这个完整的配置进一步比较对最好的PMIS输出的第一轮的基础上，原来的伊辛形式。最终的最佳配置作为2 R-ParaMax的检测解决方案返回，这保证了2 R-ParaMax的裸最表2：2 R-ParaMax��Cth0.910.930.950.970.99|电话：+86-021 - 8888888传真：+86-021-8888888|/NV0.350.320.280.210.01|FML|/|F|0.970.991. 01. 01. 05执行我们现在描述我们的ParaMax实现。计算环境。基于CPU的实验在3.30GHz的Intel i9- 9820 X上执行，具有20个核心，2，189个线程和126 GB RAM。在CUDA平台上进行了基于GPU的实验测试在这两种通道设置下，我们生成大规模的伊辛模型，MIMO检测（每sce- nario），以便测量检测BER，最高可达10total Insts-1，约为10- 7。PMIS CPU-实施。虽然我们的PMIS实现的前端是用Python编写的，但其核心完全是用Python编写的。[34]第 11章我们只分配一个核心和一个线程（单个PE），通过手动修改OpenMP [11，14]和C++并行化设置来计算每个PMIS。此外，为了最大化PMIS的性能（以满足无线标准中有限的处理时间），已经实现了以下创新：（1）静态存储器的使用：与动态分配不同，静态分配发生在全局范围内，并且当库被加载时它被预填充。此外，由于数组的大小是事先已知的，编译器可以进一步优化静态数组上的数学运算。（2）参数包扩展：矩阵-矩阵和向量-矩阵乘法中的循环是PMIS实现中最昂贵的部分。为了进一步降低计算成本，大多数关键循环都是使用参数包扩展等功能静态展开的，在标准中引入了11+11 （3）Intel SIMD指令：大多数现代CPU体系结构中的浮点数具有内在的操作，允许在浮点数的连续数组上进行多个操作在PMIS中，我们使用英特尔SIMD指令来矢量化矩阵-矢量和矢量-矢量乘法等操作[56]。PMIS GPU-实施。CPU-ParaMax的核心设计基于高度优化的SAC++实现。因此，ParaMax到GPU的自然扩展包括核心SA引擎到GPU的实现。然而，与CPU不同，GPU在同时应用多个同步操作的大型阵列中实现最佳性能。事实上，虽然GPU比CPU具有更多的核心，但每个单个GPU核心通常要慢得多。因此，为了最大限度地提高GPU上实现的SA的性能，我们设计了一个基于JAX/XLA语言的GPU内核，可以同时更新多个PMIS运行。更准确地说，对于单个PMIS运行的自旋配置s（在方程中）。5）现在扩展到矩阵S= s ，其中对应于PMIS索引。由于PMIS运行彼此完全独立，因此s （）可以独立且同步地更新。第一轮（R1）PMIS开启NPE处理元件输入：Ising形式输出：NPEIsing带Ising形式自旋检测置信度输入：NPEIsing配置输出：每个自旋变量的检测置信度CN 独特的u对应，O（）计算置信度Cj中间预决策输入：置信度C，阈值Cth（如果Cj> Cth，输出：决定的自旋，更新的Ising决定第j个自旋变量第二轮（R2）PMIS，NV）输入：更新的Ising表格输出：NPEIsing表格，更新的伊辛表格伊辛溶液过滤器输入：所有Ising输出：最佳Ising配置（min）最佳Ising配置结合预先决定的旋转更新的伊辛（N'V新增功能在每个PE上运行在每个PE上运行2021年10月25日至29日，美国路易斯安那州新奥尔良市，Minsung Kim，Salvatore Mandrà，Davide Venturelli，KyleJamieson49延迟[us]×××|O|）|O|≤=2 =3 =4×灵活(a) 计算完全并行的成熟C++内核CPU-ParaMax的延迟。(b) 单个器件：9.3 TFLOP GPU-ParaMax vs 0.028 TFLOP CPU-ParaMax。图9：ParaMax检测延迟。6评价在本节中，我们从各个方面评估ParaMax第6.1节评估了ParaMax的检测延迟与其他基于CPU和GPU的检测器的比较。第6.2节说明了ParaMax的采样性能与模拟退火的比较，以及ParaMax在大型和大规模MIMO中实现接近ML性能所需的处理元件数量第6.3节和6.4节分别显示了ParaMax的误码率和系统吞吐量性能，并与大型和大规模MIMO中的其他最先进检测器进行了比较。6.1检测等待时间全平行全吹塑ParaMax。图9（a）显示了ParaMax的检测时间，它是每个信道使用的（=log 2）的函数，其中背景颜色

下载后可阅读完整内容，剩余1页未读，立即下载