5G前传切片架构：数据平面可编程交换机的实现与评估

116 浏览量更新于2024-02-04 收藏 1.12MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

723→FSA：使用数据平面可编程交换机的5G前传切片架构尼尚特·布德德夫新加坡国立大学拉杰·乔希新加坡国立大学普拉温·戈文丹·卡纳南IBM研究院-印度陈敏春新加坡国立大学图利卡·米特拉新加坡国立大学摘要近年来，5G网络在开发和部署方面正在加快步伐5G的主要目标之一是支持具有不同服务水平目标（SLO）的各种用例。切片是5G的关键部分，它允许运营商为不同的用例提供一组量身定制的资源，以满足他们的SLO。现有的工作集中在前端或C-RAN中的切片然而，切片是URLLCMMTC前端前传C-RANEreceRE低功耗硬件高性能可靠硬件商用硬件在将前端连接到C-RAN的前传网络中缺失这会导致前传中的过度供应，无线时间表前传数据包网络调度器C-RAN，也限制了网络的可扩展性在本文中，我们设计并实现了前传切片Ar。123 4时间4321架构（FSA），据我们所知，是前传网络的第一个切片架构FSA在交换机数据平面中运行，并使用来自无线调度的信息来识别线速前传数据分组的切片它支持多点到多点路由以及分组优先级处理，以在前传和C-RAN中提供复用增益，从而使系统更具可扩展性。我们的测试平台评估使用规模扩大的LTE跟踪表明，FSA可以支持准确的多点到多点路由80 Gbps的前传流量。此外，FSA的数据包优先级启用的切片感知数据包调度可CCS概念• 网络无线接入点、基站和基础设施;可编程网络;无线接入点、基站和基础设施;可编程网络。关键词5G蜂窝网络，切片，可编程开关ACM参考格式：Nishant Budhdev ， Raj Joshi ， Pravein Govindan Kannan ， MunChoon Chan，and Tulika Mitra.2021年FSA：使用数据平面可编程交换机的 5G 前传切片架构在第 27 届移动计算和网络国际年会（ACMWEBCOM '21）上，2021年10月25日至29日，美国路易斯安那州新奥尔良。ACM，美国纽约州纽约市，13页。https://doi.org/10.1145/3447993.3483247本作品采用知识共享署名国际4.0许可协议进行许可2021年10月25日至29日，美国路易斯安那州新奥尔良市，©2021版权归所有者/作者所有。ACM ISBN978-1-4503-8342-4/21/10。https://doi.org/10.1145/3447993.3483247图1：前传切片架构（FSA）概述1引言5G网络旨在支持物联网、智能交通系统、远程医疗、工业控制系统等不同领域的用例，超出了先前蜂窝网络技术所支持的语音和数据的基本使用情况。因此，5G网络需要为这些新用例提供一组不同的服务水平目标（SLO）。与此同时，5G网络已经探索了云无线电接入网（C-RAN）架构的使用，因为它允许运营商通过复用资源来降低成本，并通过集中和协调的决策来实现新功能[1-3 ]。图图1示出了C-RAN架构的简化视图。它包括：（1）负责发送和接收由增强型无线电设备（eRE）组成的无线电信号的无线电前端，（2）具有负责处理被称为增强型无线电设备控制器（eREC）的无线电信号的计算元件的RAN，以及（3）使得能够在eRE和eREC之间传送数字化无线电信号的前传网络。为了支持不同的SLO，5G引入了一种称为切片的关键技术，该技术允许运营商在共享基础设施上支持多个虚拟网络[4]。这允许网络运营商针对特定用例部署一组量身定制的资源例如，低功耗硬件以及用于大规模机器类型通信（mMTC）的细粒度配置[5]，高性能可靠硬件以及用于超可靠低延迟（uRLLC）用例的对无线信道的低延迟接入[6，7]，以及用于增强型移动宽带（eMBB）的商品硬件的共享池。为此，存在探索无线电前端（无线频谱）[8]、RAN [9-12]和核心网络[13，14]中的切片的大量工作。然而，这些提议在前传网络中缺乏切片，这导致两个主要问题。首先，在没有前传切片的情况下，在eRE和eMBB}}}}}频率}}}724∼2021年10月25日至29日，美国路易斯安那州eREC [15]。这意味着来自具有连接到eRE的不同SLO的切片的用户在分配的eREC上一起处理因此，每个eREC可能必须提供用于mMTC用户的低功率硬件、用于uRLLC的高性能可靠硬件以及用于eMBB的商品硬件。这导致每个eREC过度配置各种硬件以支持每个用例的峰值工作负载，而在实践中，已知蜂窝网络流量具有突发峰值和低平均利用率[16]。此外，随着每个eRE的5G用户数量增加，eRE和eREC之间的点对点连接限制了系统的可扩展性。这是因为每个eRE的最大用户数量受到已签署的eREC的处理能力的限制。其次，在没有前传切片的情况下，运营商缺乏在前传网络中提供差异化服务的能力诸如分组优先级之类的服务可以帮助运营商满足不同的SLO，而不会过度配置前传网络。总之，前传切片的缺乏导致前传和C-RAN中的过度配置，并限制了5G网络的可扩展性。在本文中，我们通过在前传网络中启用切片来解决上述问题。前传分片实现了多点到多点路由，这允许数字化无线电信号从任何eRE路由到任何eREC，反之亦然。例如图在图1中，我们看到来自eRE的uRLLC业务（黄色）可以被路由到具有高性能硬件的eREC，而来自相同eRE的mMTC业务（紫色）可以被路由到具有低功率硬件的另一这样，每个eREC可以仅配备单一硬件类型。这还提高了C-RAN中的资源效率，因为来自若干eRE的业务可以跨组合的eREC池被复用。这种基于切片的路由还实现了最近提出的C-RAN架构[17- 21 ]，其通过考虑不同的切片SLO来跨多个eREC分布基带处理。此外，多点对多点路由允许运营商添加新的eREC以支持增加的流量负载，而无需升级每个eREC，从而使系统具有可扩展性。除了多点到多点路由，前传切片还支持数据包优先级。利用分组优先化，具有更严格SLO的业务（uRLLC）可以优先于前传网络中的其他业务（mMTC）。这允许运营商有效地满足不同的SLO，而不会过度配置前传网络。然而，对前传网络进行切片以实现多点到多点路由和分组优先级排序并不简单。第一个挑战在于识别前传网络分组所属的切片/用户。这一挑战源自C-RAN架构中部署的功能划分功能划分定义了如何在eRE和eREC之间划分业务处理由于需要降低预计将在5G中大量部署的eRE的成本，通常选择的功能划分将最大限度地减少eRE的处理量[22，23]。因此，接入层（MAC）中可用的切片标识符信息在上行链路方向上的前传分组中缺失，因为eRE在最常见的功能划分中不执行MAC层处理[24]。换句话说，不可能查看前传网络中的分组并识别其所属的切片/用户。第二个挑战是在用户已经被发送到网络之后正确地路由前传数据分组。鉴定在蜂窝网络中，近70%的用户会话持续时间非常短（活动时间为1毫秒）[25]。因此，执行多点到多点路由所需的信息-切片/用户标识符和目的地eREC-以非常高的速率变化。由于控制平面的高延迟，经由控制平面更新其路由表的常规交换机不支持这种高频路由更新[26]。我们的解决方案称为前传切片架构（FSA），解决了以下两个挑战。首先，我们观察到，虽然切片/用户信息在前传分组中可能不可用，但是该信息在无线调度中可用，因为蜂窝网络中的所有传输都由网络调度器提前调度。结果，可以使用预先生成的无线调度精确地识别前传中的所有分组的切片信息。基于这种观察，我们的关键思想是将无线调度转换为预期的上行链路分组序列，并在前传中使用该序列来识别切片/用户。图图1示出了无线调度与前传中的上行链路分组的对应序列之间的关系的简单表示为了解决第二个挑战，并使多点到多点路由，FSA介绍了一种高频动态转发方案，其中前传交换机的路由表不断更新的基础上，预先知道的无线调度。这使得FSA能够将前传分组路由到正确的eREC，其中每毫秒独立地为每个eRE生成无线调度。FSA利用可编程交换机来实现切片识别和高频动态转发。 FSA完全在数据平面中运行，并实现基于SRAM的动态路由表，该路由表可以在交换机数据平面中以线速更新。我们还构建了一个切片感知的数据包调度器，作为FSA启用的数据包优先级的示例用例。分组调度器基于分组所属的切片和用户的预期基带处理时间来对前传分组进行优先级排序。总之，我们做出了以下贡献：据我们所知，FSA是第一个通过在交换机数据平面中以线路速率识别每个数据包FSA通过高频动态转发方案实现多点到多点路由，该高频动态转发方案允许从任何eRE向任何eREC动态地路由前传分组。转发方案的设计可以以最小的开销处理分组丢弃和重新排序。FSA还在前传网络中启用分组优先级。作为一个示例用例，我们设计并实现了一个切片感知的数据包调度器，通过在交换机数据平面中使用最小松弛时间优先（LSTF）调度来最大限度地减少延迟敏感切片的延迟。我们在IntelTofino[27]可编程交换机上实现FSA以及多点到多点路由和数据包优先级（由其启用）这两个功能。我们在硬件测试平台上使用通过升级真实LTE迹线获得的5G迹线来评估FSA我们的研究结果表明，转发调度可以在线速率在交换机数据平面中更新，并且最坏情况下的延迟小于6 s，这小于5G中62.5s的最小调度时隙 [28]。此外，我们的评估表明，FSA可以···725∼FSA：使用数据平面可编程交换机的5G前传切片架构ACM 2021年10月25日至29日支持精确的多点到多点动态路由，从8个基站发送的总前传流量为80 Gbps与基于FIFO的调度器相比，通过在FSA上实施切片感知数据包调度（最小松弛时间优先），我们观察到延迟敏感流量的细流完成时间的第95百分位数减少了4倍。此外，FSA的实现在交换机数据平面中消耗很少的额外资源，仅需要10.42%的额外SRAM使用率。其余文件的结构如下。第二章介绍了本文的背景和相关工作。§3和§4给出了FSA的高频动态转发方案的设计我们在§5中详细介绍了切片感知的分组调度，并在§6中评估了FSA。在第7节中，我们讨论了如何修改FSA以支持其他功能拆分，最后在第8节中得出结论。2背景和相关工作职能划分。随着C-RAN的引入，网络运营商现在可以在eRE之间分配无线电处理eREC。这种分布被称为功能分裂。在一个极端中，几乎所有的无线电处理都在eRE（传统RAN设计）上完成。这些被称为高级功能分裂。另一个极端是几乎所有的无线电处理都在云中执行（eREC）。这些被称为较低的功能分裂。在这两个极端之间，存在各种功能拆分选项，其中每个拆分提供前传设备的成本与RAN的CAPEX/OPEX之间的独特权衡随着在eRE中执行的无线电处理的量增加，eRE的成本也增加;而前传网络中的业务量减少。相反，集中式无线电处理可以显著降低eRE的成本[22]，但这些收益伴随着为前传业务提供高吞吐量和低延迟的需求。本文中的其余讨论考虑了将大部分基带处理功能分配给eREC的7-2拆分[29]。这种拆分通过移除与无线网络调度的未分配部分相对应的IQ样本来显著降低前传吞吐量。在第7节中，我们讨论了FSA如何为其他功能分割启用前传切片。2.1相关工作蜂窝网络中的切片由于其用于实现各种各样的SLO并确保有效的资源使用的益处而受到大量关注。由于切片计算资源和核心网络的容易性，大部分关于切片的研究都集中在RAN [9 PRAN[30]为与eRE相关联的用户引入了灵活的RAN处理。这种灵活性允许每个切片的用户具有定制的数据平面处理和专门的功能，以满足他们各自的SLO。为了将这种灵活性扩展到无线信道，Orion [8]提出了一种RAN切片架构，该架构在无线信道中引入切片，以支持用于低延迟和低功耗用例的较小调度间隔。与RAN和核心网络不同，由于前传业务的高吞吐量和低延迟性质，前传中的切片具有挑战性。Larsen等人[31]表明，虽然对分组交换前传网络进行切片的功能。前传切片也可以用于支持在同一物理网络上具有不同功能划分和SLO的多个网络运营商[32]。在过去的十年中，已经为前传网络开发了多种协议，例如通用公共无线电接口（CPRI）[15]、IEEE 802.1CM [33]、开放基站架构倡议（OBSAI）[34]等。在这些协议中，CPRI是前传网络最广泛采用的协议。 CPRI使用串行接口，以恒定的比特率在前传中传输数字化的无线电样本。然而，由于其串行接口，CPRI只能支持点对点传输，因为它不使用基于以太网帧/数据包的传输。这与集成协议设计和高吞吐量一起使得CPRI对于5G网络非常低效因此，该协议的后继者被开发出来，称为增强型CPRI（eCPRI）[35]，它建立在以太网/IP协议之上eCPRI还支持各种功能分割，使运营商能够优化其前传网络。此外，eCPRI使用模块化协议栈，使蜂窝运营商能够使用标准协议进行控制消息传递和时间同步，同时仍使用eCPRI传输数字化无线电样本。与eCPRI类似，IEEE 802.1CM [33]也使用基于数据包的前传网络传输。802.1CM还为运营商提供了使用3位优先级代码点字段[36]将前传流量分类为8个不同优先级类别的能力，类似于LTE中可用的QoS类别标识符[37]。然而，将前传流量分类和优先级划分为仅8个唯一类别限制了支持具有不同SLO的各种用例的能力。此外，该信息不足以支持对5G中的扩展至关重要的灵活的多点到多点前传网络。此外，对于较低的功能划分，切片/用户信息在eRE处不可用，并且因此标记上行链路业务的优先级类别需要非平凡的解决方案。相比之下，使用eCPRI的FSA可以支持较低的功能划分，提供每用户切片和优先级以及多点到多点路由。3设计空间与挑战为了在前传网络中提供多点到多点路由和分组优先级，第一步是识别前传中每个分组的切片回想一下，切片信息对于大多数函数拆分都不可用如前所述，我们的关键见解是使用无线时间表（预先已知）来识别切片。鉴于这一关键见解，在本节中，我们将描述在实践中可以实现的各种方式请注意，虽然业务流是双向的，但在本文中，我们关注上行链路方向（eRE到eREC），因为对于大多数功能划分，切片/用户标识信息在eRE处不可用。在eRE上识别来自用户的上行链路无线传输由eRE接收，然后被数字化以传输到eREC。如果向eRE提供无线调度，则它们需要在传输之前用切片/用户标识符和路由信息两者来标记分组。在eRE上实现这样的功能是不平凡的，因为大多数eRE使用专用硬件进行处理，其不容易支持添加新特征。此外，支持这样的功能2021年10月25日至29日，美国路易斯安那州新奥尔良市，Nishant Budhdev，Raj Joshi，Pravein Govindan Kannan，Mun Choon Chan，and TulikaMitra726∼新的eRE将增加5G的成本，因为eRE的数量将显着增加以弥补较小的覆盖范围[16]。最后，在严格的定时约束内协调具有大量eRE的无线调度需要高协调复杂度。在eREC中识别一个截然相反的解决方案是在eREC中实现切片识别，作为在服务器上运行的网络功能。在这种情况下，eREC将知道上行链路无线调度，然后它们将用切片和路由信息标记传入的前传数据分组。然而，由于5G中的每个基站能够生成超过300Gbps的前传业务[35]，并且每个C-RAN可以管理1000个基站，因此我们需要跨100个服务器扩展前传切片操作，类似于传统的L4负载平衡[ 38 ]。这将大大增加C-RAN的CAPEX和OPEX。去程交换机上的标识在FSA中，我们采取中间立场，在前传网络中的交换机上实现前传切片。在这样的部署中，无线调度器将调度发送到前传网络中的网络交换机与eRE处的切片相比，该场景中的调度协调简单得多，并且没有可扩展性问题，因为所涉及的网络交换机的数量相对较小。每个交换机同时服务于大量的基站，处理高达几个Tbps的流量。先前的工作表明，当由交换机执行时，诸如L4负载平衡的网络功能可以取代数百个服务器[39]。因此，在交换机上进行标识以支持多点到多点路由和数据包优先级排序是很自然的。虽然使用无线调度来识别分组的切片的高级洞察可能听起来很简单，但首先，上行链路无线网络调度可以被认为表示在1ms的时隙内分配给不同用户的频率资源块的数量。使用此信息进行切片识别并不简单。此外，仅提前4ms生成调度，并且每1ms生成新调度因此，FSA必须以高速率和低延迟识别每个数据包的切片。关键的想法。我们的关键思想是将eRE的上行链路无线调度转换为转发动作序列，该转发动作序列对应于eRE将在上行链路上发送分组的序列（参见图1B）。①的人。然后，我们在交换机的数据平面中安装此转发动作序列，在此它们依次应用于到达的上行链路数据包。我们不断更新交换机数据平面中的转发动作序列，因为无线调度每隔1 ms就会发生变化。在传统的网络交换机上不可能实现这个想法，因为“匹配动作”范例限制这些交换机仅基于被转发的分组的内容来执行分组转发。相反，我们使用一种新兴的可编程交换机[27，40，41]，它允许我们更灵活地进行数据包转发和调度。可编程交换机通过可重新配置的匹配操作管道提供灵活的数据包解析（自定义报头）和报头操作。最重要的是，它们提供了允许有状态处理的事务性有状态内存以线路速率传输数据包这使我们能够使用额外的信息，如定时和字节计数，使转发和调度决策。由于事务性有状态存储器可以在数据平面中以线速率更新，因此我们可以在更新转发动作序列时提供亚毫秒级的定时保证，以跟上无线调度的变化。4设计实施我们的设计利用了两个关键的观察结果：（i ）即使在前传（eCPRI）数据分组中没有明确的用户标识符，每个分组也包含唯一的序列号（图2）。2）单调增加，以及（ii）前传中的分组到达序列可以根据由无线网络调度器生成的上行链路传输调度来确定。我们利用上行链路传输调度加上单调增加的序列号来识别用户。高级工作流。在FSA中，在网络调度器生成传输调度后，它首先被转换为一系列[序列号，目的地服务器ID]对（§4.1）。然后，该信息通过特殊的“调度包”或s-包发送到交换机。每个s-分组包含对应于无线调度中的每个用户的[序列号，目的地服务器ID]对。为了帮助在无线调度中区分来自用户的分组，该对中的序列号是指用户的最后一个前传数据分组的序列号。为了在交换机中存储这些信息，FSA使用了一个为了在高速网络数据平面中操纵这个“环形缓冲区”，FSA另外维护一个读和一个写索引。当交换机接收到s-分组时，它将来自分组的条目添加到“环形缓冲区”中，从写索引所指向的位置开始，并相应地增加写索引。当交换机接收到前传数据包时，它读取环形缓冲区中由读取索引指定的位置处的条目。在接收到特定用户的所有数据包时（基于时间表），FSA递增读取索引。最后，由于网络调度是为每个基站单独生成的，FSA为每个基站维护一个唯一的环形缓冲区以及单独的读写索引。FSA使用基站的48位源MAC地址将处理重定向到正确的总之，FSA实现了完全在交换机数据平面中运行的高速动态转发方案。4.1无线时间表转换FSA使用无线调度来识别前传中每个数据包的切片/用户。这是可行的，因为蜂窝网络中的所有传输然后，这些预定用户的数字化无线电样本通过前传传输。在每个时间间隔中生成的样本的数量取决于基站属性，诸如采样频率、无线带宽、样本大小等，以及职能划分，这些都是先验已知的，很少改变。使用这些属性结合无线调度器提供的无线分配，我们可以计算数字化无线电样本的大小以及前传的数量FSA：使用数据平面可编程交换机的5G前传切片架构2021年10月25日至29日，美国路易斯安那州新奥尔良市，727FCSRies序列服务器编号ID2字节2字节条目数1字节子帧ID1字节基站MAC地址6字节乌勒恩特heds-分组报头SceCPRI通用以太网前导码Se序列号2字节通道ID2字节ChFCSIQ配对eCPRI IQ报头eCPRI通用以太网前导码图2：两种消息类型的eCPRI报头无线调度中每个用户的分组 FSA然后将此信息与eCPRIIQ报头中的数据包序列号字段一起使用（见图10）。2）以线速率识别前传中每个分组的切片/用户。S-分组的生成。当生成无线调度时，调度器还制作s-分组，其是具有自定义消息类型和报头字段（如图1B所示的“s-分组报头”和“调度报头”）的常规eCPRI分组。二、s-分组报头包含基站MAC地址，该地址用于标识调度条目应该被添加到的适当基站。报头中的字段“条目数”对应于s分组报头中的条目数。随后的标题由计划条目列表组成。每个条目对应于在无线调度中被分配资源的用户，并且包含被写入环形缓冲器以准确地识别和路由用户的信息。4.2转发信息一旦交换机接收到s-分组，FSA首先通过使用s-分组报头中的“基站MAC地址”字段来识别调度分组的基站ID在识别基站ID之后，FSA：(1) 将[16位序列号，16位目的地服务器ID]写入环形缓冲区中由写入索引指示的索引处(2) 递增环形缓冲区的写入索引(3) 递减s包中的头字段(4) 从s分组中删除相应的调度条目(5) 如果“条目数”不为零，则将数据包循环回去(6) 如果“条目数”变为零，则丢弃数据包图3、总结了这个过程。在环形缓冲区中的每个条目const，一个16位的序列号和一个16位的目的地服务器ID，这是一起存储在一个32位SRAM寄存器。16比特序列号对应于属于用户的最后一个前传分组的序列号。请注意，我们存储16位服务器ID而不是物理服务器目的MAC/IP地址，以减少环形缓冲区中的存储开销。为了将服务器ID转换为其目的地MAC/IP地址，我们使用标准的匹配动作表，因为C-RAN中的服务器总数大多是恒定的。仅当在C-RAN中添加/移除服务器时才更新该表。因此，对于每个基站，我们可以支持高达65K的唯一目的地址。环形缓冲器仅保持与在接下来的几毫秒内已被分配无线资源的用户相对应的条目。因此，存储[序列号，目的地服务器ID]对所需的SRAM存储器的量显著减少。然而，至关重要的是，这种紧凑表示也可以处理数据/eCPRI分组的丢失和/或重新排序因为路由方案仅依赖于前传分组的排序。我们将在第4.4节中讨论这些问题。4.3环形缓冲器在我们的解决方案的核心是设计的环形缓冲区的数据结构，使高频率的动态转发在交换机数据平面。交换机数据平面提供交换机数据平面中的高速事务有状态存储器，其以基于SRAM的寄存器阵列的形式可用。（i）由于交换机数据平面中可用的SRAM存储器的有限大小（几十MB），环形缓冲器必须在严格的存储器约束内实现，以便按比例缩放到几百/几千个基站和用户。（ii）交换机数据平面中的SRAM存储器块是单端口的（出于功率和成本原因），因此使用它们构建的寄存器阵列在一次存储器访问中只能读/写单个条目此外，为了保持数据平面中的线速率处理，在数据包的单个数据平面传递中仅允许一次存储器访问[42]。在本节中，我们将介绍如何在处理这些SRAM内存限制的同时设计环形缓冲区。FSA为连接到交换机的每个基站维护一个环形缓冲区。每个环形缓冲区至少有40个条目，因为无线调度至少提前4 ms生成，每个调度包含不超过10个用户[43]。我们还为每个环形缓冲区维护一个读和写索引写入索引指示将由s分组添加新调度条目的位置。读取索引指示包含切片/用户标识和下一个传入前传数据分组的路由信息的位置。读索引和写索引之间的序列号的范围指示由网络调度器在接下来的几毫秒中调度用于在网络中传输的前传分组的序列号通过仅在短时间窗口内的SRAM所需的环形缓冲区。为了解决第二个约束，我们实现了一个跨多个寄存器阵列的环形缓冲区。因此，即使programmable开关硬件允许访问寄存器阵列中的一个单一的索引，每个通道，我们现在可以读/写多个条目，通过访问数据从每个寄存器阵列并行。我们使用术语拆分比来表示用于实现环形缓冲区的寄存器阵列的数量对于分流比：1，环形缓冲区被划分为寄存器阵列。显然，SRAM由可以使用交换机数据平面架构中可用的SRAM存储器块形成的寄存器阵列的数量限制在我们的实现中，分光比为4：1（见图1）。（3）第三章。4.4处理重新排序丢弃由于FSA使用数据包排序来构建和不断更新数据平面中基于调度的路由表，因此处理重新排序和数据包丢弃以保持一致的路由是极其重要的。图4显示了可能导致错误用户识别的数据包序列示例（以红色突出显示的如果没有适当的照顾，路由上下文失去同步，并可能路由数据包到错误的目的地的情况下，错误的识别。处理重新排序/丢弃的一种方式是将接收到的分组的序列号与环形缓冲区中的多个条目进行比较。2021年10月25日至29日，美国路易斯安那州新奥尔良市，Nishant Budhdev，Raj Joshi，Pravein Govindan Kannan，Mun Choon Chan，and TulikaMitra728一BC DA B C D EF}}{{1}剩余环形缓冲区项公共报头L2eCPRI的条目数寄存器阵列链接比特序列用户214用户113101102D C B A6 0number解析子帧图3：使用s-packet在环形缓冲区中添加条目。红色小箭头表示写入索引。如果s-分组具有剩余的缓冲区条目（左侧的情况），则其被再循环，否则被丢弃（右侧的情况）。5 32 14 3 0 1图4：有效和无效的数据包序列顺序目的地当用户的最后一个环形缓冲区条目传入分组1010 00左移序列号number{比拟1038读索引假地址最终目的地地址38时间表被删除了。该分组可以使用eCPRI报头中的特定比特（级联比特设置为0）来标识，如图1B所示四、这样的丢弃导致读取索引不能正确地向前移动到下一个用户。值得注意的是，由于FSA 在单次传递中读取转发条目，因此即使读取索引滞后（我们称之为漂移），转发仍然可以正确地继续。但是，如果由于多次数据包丢弃而导致此漂移增长超过100，则可能导致FSA错误识别用户并错误地路由它们为了纠正这种情况，我们跟踪漂移，即。的dif-图5：处理数据平面中的重新排序然而，由于基于SRAM的寄存器体系结构的限制，只有一个条目，从每个寄存器阵列可以在一个单一的数据包通过访问。然而，如前所述（第4.3节），由于我们使用寄存器阵列实现环形缓冲区��，我们现在可以查找��连续条目进行比较，以在存在数据包重新排序和丢弃的情况下识别正确的切片/用户。4.4.1重新排序。 eCPRI协议报头包括一个序列号，允许我们检测消息重新排序[35]。在FSA中，我们不保证在交换机上无序接收的数据包的顺序相反，我们检测潜在的重新排序，并确保它不会导致错误识别和路由错误。识别重新排序的逻辑在下面提供在传入数据包时，我们��从调度中读取后续条目，以与传入数据包的报头的序列号进行比较。比较可以导致以下后续步骤：(1) 首先，如果数据包序列号小于阵列寄存器中的所有位值，则数据包到达太迟。我们可以丢弃数据包，将数据包多播到所有服务器，或者将数据包转发到可以确定数据包目的地址的服务器。我们把这个决定留给手机操作员。(2) 如果数据包序列号大于所有序列号值，则数据包过早到达在这种情况下，我们在交换机内重新循环数据包以延迟其处理。(3) 最后，对于数据包序列号与其中一个条目匹配的情况，FSA只需使用相应的服务器ID将数据包路由到正确的目的地（如图所示）。5）。4.4.2数据包丢失。回想一下，由于蜂窝网络的实时性质，在前传中不存在用于数据分组重传的机制。因此，数据包直接丢弃读取的索引与通过比较序列号识别的用户的索引之间的参考当具有连接位0的数据包被丢弃时，该漂移值将随着每个后续数据包而增加。当漂移值增加超过阈值时，我们生成一个“漂移包”，它将根据漂移值调整读取索引。例如，如果漂移值为负，则意味着读取索引始终落后于通过使用序列号识别的实际用户索引。一旦该值达到阈值，我们就会生成一个“漂移包”并将其发送到再循环端口。为了生成“漂移包”，我们克隆任何传入的数据包，并在将其发送到再循环端口之前添加自定义报头。当数据包再循环时，它将增加读索引以修复错误。4.4.3计划数据包丢弃。为了处理s-分组丢弃，我们跟踪子帧ID（参考图2）。2）为每个基站接收的最近S分组在丢弃的情况下，当交换机接收到子帧ID不是紧接的下一个值的s分组时，它在数据平面中生成NACK分组以通知网络调度器对分组进行重传由于网络调度提前4毫秒生成，并且eREC和交换机之间的前传中的往返时间小于10毫秒（§6.5），因此s分组的重传可以在交换机处接收到与调度对应的数据分组4.5把它放在一起图图6说明了交换机数据平面上FSA的关键组件以及如何处理eCPRI数据包。当交换机接收到eCPRI数据包时，它首先检查该数据包是来自调度器的前传数据包（IQ）还是s数据包。然后，FSA分别使用源MAC地址或基站MAC地址字段获得分组的基站ID如果它是前传数据分组，则它访问基站ID的读取索引，并读取2 0F E2 00 0050261更大05 08更大虚假真75121038更大1275更大真08056102{{{条目number下降5432054310再循环5421 0432 10FSA：使用数据平面可编程交换机的5G前传切片架构2021年10月25日至29日，美国路易斯安那州新奥尔良市，729目标服务器IQ数据eCPRI消息类型？序列号击中比较（§4.3）晚NF服务器早期检查非去除附表数据条目标题中的零（§4.2）（§4.2）零分组到达写入索引环形缓冲区（§4.1）读索引获取基站IDL2/L3转发表服务器ID到MAC/IP地址（第4.2节）图6：FSA的关键组成部分4 来自环形缓冲区的条目然后，它通过左移数据包报头中的16位序列号来生成32位序列号，并将其与从环形缓冲区读取的值进行如果存在与任何条目的匹配，则它使用服务器ID直接访问目的服务器的MAC/IP地址。另一方面，如果数据包是s-数据包，FSA访问写索引并在环形缓冲区中写入多达4个条目然后，它更新报头中的条目数，并重新循环数据包，直到所有条目都写入环形缓冲区。一旦所有条目都被写入，数据包就会被丢弃。FSA的开销。在FSA中，将转发信息存储在环形缓冲区中会消耗数据平面中基于SRAM的存储器资源。考虑到提前4个子帧/时隙生成网络调度，并且在每个子帧/时隙中存在用于最多10个用户的上行链路数据，FSA要求每个基站的环形缓冲器中有40个条目。此外，使用s-分组更新该转发信息引起一定量的延迟和带宽开销。从我们的评估中，我们表明，它需要一个s-数据包不到2 秒写入多达10个条目的数据平面的数据包需要多次再循环，因为FSA可以写4个条目，在每个通道。对于带宽，由于FSA需要额外的s-包，也是再循环的，它会影响交换机流水线处理和链路带宽消耗。此开销与交换机支持的基站数量成线性比例。FSA还消耗链路带宽用于将s分组从C-RAN中的网络调度器传输到前传中的交换机在评估（§6）中，我们表明交换机流水线和链路带宽开销实际上可以忽略不计网络追踪5FRONTHAUL数据包调度在第3节中，我们描述了FSA如何识别前传数据包的用户（以及切片），以实现多点到多点路由。蜂窝运营商还可以使用该信息来提供差异化服务，例如前传中的分组优先级在本节中，我们将介绍FSA如何通过在交换机数据平面中设计最小松弛时间优先（LSTF）调度器，通过调度来提供数据包优先级。5.1LSTFLSTF [44，45]以松弛时间的递增顺序调度分组直到每个数据包的最后期限为止的剩余时间每个数据包的松弛时间是从其截止日期减去当前等待时间和总处理时间后剩余的多余时间。_=(−_ )��–在实践中，LSTF可以最小化平均流完成时间，最小化尾部延迟并实现每个流的公平性。所有这些都是5G前传中的分组优先级排序/调度调度算法的期望属性，以支持具有不同期限的用例，诸如工业自动化（ uRLLC ）、智能传感器网络（ mMTC ）和AR/VR、4K流视频（eMBB）。此外，在每个调度中，用户可以被分配不同量的无线频谱，因此在C-RAN中需要不同的处理时间。因此，有益的是在前传中具有考虑不同分组截止时间的分组优先级划分/调度算法，使得具有较短截止时间的分组在前传中花费很少的排队斯特劳曼溶液。一种方法是在源（eRE）处将分组截止线包括在分组中（经由附加报头）。然后可以通过减去交换机的每个优先级队列的等待时间来计算松弛时间。每个数据包的秩将是松弛时间和到达时间之和[46]。然而，这需要eRE知道用户类型，计算相应的松弛时间并将其添加到报头中。我们的方法。我们的方法不需要任何额外的header。我们计算松弛时间的每个组成部分如下：(1) Deadline：我们在虚拟服务器ID地址空间中创建多个分区，以寻址属于不同用例/MVNO的服务器。这种方法允许我们识别用户类型和相应的截止日期。对于uRLLC、mMTC和eMBB用户，我们分别使用0.6 ms、2.5 ms和2.5 ms的最后期限[43]。这些截止日期可以根据部署的网络配置进行更改。(2) 处理时间：每个用户的处理时间取决于多个因素，例如分配的带宽、调制方案、空间层的数量等。然而，我们知道每个用户的前传数据包的数量也与分配的带宽和空间层的数量成比例。因此，我们可以使用存储在环形缓冲区中的数据包序列号来计算每个用户的相对处理时间。请注意，所使用的调制方案不会影响用户的前传数据包数量，并且对所需的基带处理时间的影响有限[47]。(3) 等待时间体验：对于每个数据包，我们需要测量预期的单向延迟，并添加/减去任何额外的延迟/提前。这可以计算为：__=__+（��–我们使用eCPRI中提供的单向延迟测量机制，该机制定期发送消息类型为5的数据包，以测量单向延迟。该值可以存储在数据平面的寄存器中或匹配动作表中，并通过控制平面进行更新为了计算前传中每个数据包所经历的延迟，我们利用了前传流量本质上是恒定比特率的事实，因此数据包到达间隔几乎是恒定的。因此，如果分组在上游交换机中经历额外的延迟，则对于延迟的分组，分组间到达间隙将更大。从计算出的数据包间间隙中减去预期的数据包间间隙，2021年10月25日至29日，美国路易斯安那州新奥尔良市，Nishant Budhdev，Raj Joshi，Pravein Govindan Kannan，Mun Choon Chan，and TulikaMitra730∼321059365593667211972120892711840 11841时间（ms）时间（ms）(a) 来自相同基站的分组到达（b）来自不同基站的到达主机1的分组图7：验证FSA实现多点到多点路由能力的数据包到达序列快照数据包到当前时间所经历的延迟使用时间同步对等待时间进行更精确的测量超出了本文的范围虽然传统的分组转发器并不明确支持LSTF，但Sharma et al. [48]提出了一种在可编程开关上实现LSTF（近似）的新方法使用这种方法，我们能够根据数据平面中计算的松弛时间为每个前传数据包分配适当的优先级值。所有uRLLC用户被分配值7，其对应于最高优先级值（对于8个优先级队列）。剩余的用户被分为7个不同的组，基于他们的用户传输大小和经历的延迟。总的来说，LSTF的实现在数据平面中只包含20行P4代码。6评价FSA在Intel Tofino交换机上以1000行P4代码实现[49]。我们使用Intel P4 Studio 9.2.0 [50]编译FSA的P4代码并将其加载到交换机数据平面中。我们使用真实和合成的蜂窝网络数据包跟踪的硬件测试平台上评估FSA我们的主要发现是：FSA能够支持从8个基站到4台主机的10 Gbps合成流量FSA能够以低延迟（0.5 s-2 s）在数据平面中完全更新路由信息。与FIFO相比，FSA使用LSTF将uRLLC用户的第95百分位细流完成时间缩短了4倍FSA在交换机数据平面中分别使用不到10%和6%的SRAM和TCAM资源实验装置。我们的测试平台由2个Wedge 100 BF-32 X交换机[51]和Intel Tofino可编程ASIC以及commodity服务器组成。第一个交换机运行FSA，负责对

下载后可阅读完整内容，剩余1页未读，立即下载