助力5G网络建设:中兴软硬件加速技术优化5G用户面

发布时间:2019-07-09

3GPP R15中定义了5G应用有三大场景:eMBB(enhanced Mobile Broadband 增强移动宽带)、URLLC(Ultra Reliable Low Latency Communications 极可靠低延迟通信)和mMTC(Massive Machine Type Communications 海量机器通讯),其中eMBB场景提供大流量移动宽带业务,主要面向人网业务,如高速下载、高清视频、VR/AR等,峰值速率超过10Gbps;URLLC场景提供超高可靠超低时延通信,如自动驾驶和工业自动化要求端到端99.999%高可靠和端到端小于1ms超低时延。

当前虚拟化用户面针对5G 商用场景的不足

为满足以上5G应用场景大带宽和低时延的特性要求,5G核心网的用户面在部署时不仅要下沉到边缘或区域数据中心以减少传输时延,而且还要大幅减少用户面报文的转发时延。但是5G核心网的设计都是基于NFV虚拟化架构,硬件普遍采用x86通用服务器,而x86通用服务器的I/O性能如吞吐量、时延等远不如传统的专用硬件 ,无法满足5G 场景的商用部署要求。因此需要对虚拟化用户面的I/O性能进行优化和加速,降低业务时延,提高系统带宽,从而取得更好的业务适应性。为了提供虚拟化用户面的I/O性能,中兴通讯在两个方面进行了优化加速研究和应用:一种是软件加速,一种是硬件加速(主要是智能网卡加速),下面将分别进行介绍。

虚拟化用户面软件加速技术研究与应用

目前用户面最常用的I/O虚拟化加速技术是SR-IOV(Single Root I/O Virtualization),但是采用SR-IOV技术只能使虚拟化用户面的I/O性能接近基于裸金属(Bare metal)的水平,很难再有突破。因此中兴通讯在SR-IOV基础之上对上层业务流的转发流程进行了改进,引入了智能自学习功能,可以对业务流的规则进行智能学习。对于绝大多数业务流,均可匹配到业务规则,且该规则可以根据后续业务流的改变而自动修改适配,以应对业务的变化。匹配到业务规则后,对业务流进行矢量转发,并将原先的单路流进行扩充,形成多路并发流,从而提升转发效率和降低系统转发瓶颈。

图 1 基于软件加速+SR-IOV技术和纯SR-IOV技术性能对比

中兴通讯虚拟化用户面产品采用改进的软件加速技术与SR-IOV相结合,使得I/O性能有了很大提高,经实验室测试单服务器的整体吞吐量比单纯使用SR-IOV提升了一倍,达到60Gbps,几乎达到了单服务器的性能极限。除了实验室测试,还在外场进行了5G AR/VR业务的实景测试,在未开启软件加速之前,服务器在接近系统能力门限时,画面开始有卡顿和马赛克,十五分钟内有三次卡顿。在开启软件加速后,速率大幅度提升,三十分钟内无卡顿无马赛克,同时画面流畅度明显提升,用户的业务体验明显提升。

用户面硬件加速技术研究与应用

目前单靠软件加速技术还不足以满足5G场景的商用要求,还需要引入硬件加速技术。对于5G用户面的硬件加速,通常采用智能网卡(Smart NIC)进行流量卸载,即把原先由CPU处理的数据报文卸载到智能网卡上进行处理,大多数报文由智能网卡自行处理后直接转发,只有少数报文(比如流初始报文,流匹配异常报文等)才需要通过CPU处理,这样可以极大减少对CPU资源的占用,大幅提升性能并减少时延。智能网卡也有多种类型的:基于可编程阵门列FPGA的、基于网络处理器NP的、以及基于专有器件ASIC的等,中兴通讯5G用户面产品采用的是目前成熟度和性价比最高的FPGA智能网卡方案。

图 2  中兴5G用户面产品硬件加速方案

FPGA智能网卡处理数据报文的流程:服务器的中央处理器CPU根据业务动态务流信息创建业务流表下发到智能网卡,智能网卡根据CPU下发的业务流表进行数据流的快速处理,并根据数据流进行智能学习,与CPU协同进行流表的实时同步。对于需要加速的数据流报文,无需上传CPU,而在智能网卡本地即可处理转发,实现数据报文硬件级处理和转发,最大限度的降低了业务报文的使用,并节省了大量CPU的处理资源和系统IO(输入输出)资源。

中兴通讯智能网卡基于FPGA设计,硬件逻辑可以编程,拥有大容量的流表和AI智能算法,可智能识别需要加速的业务,如工业控制业务、车联网等业务。另外,中兴通讯智能网卡基于标准的ePCI(Enhanced Peripheral Component Interconnect)总线的接口设计,并在中兴通讯开放性实验室(Open Lab)通过测试,兼容目前市场上主流通用服务器。在部署场景上,中兴通讯智能网卡既可部署在中心数据机房(核心网),也可部署在边缘计算节点MEC上,部署在边缘节点上可以进一步的减少业务的转发路径,降低数据报文的时延。

由于在智能网卡上创建本地转发流表,对时延敏感性的数据流量不通过CPU而直接在网卡上处理并转出,从而大大降低了转发时延,提升了转发效率,并大幅度降低了CPU的负荷,平均报文时延从100us降低为10us,单服务器吞吐量从60Gbps提升至180Gbps。相比较软加速方案,FPGA智能网卡加速方案的转发时延降低了90%,吞吐量可以提高了200%,同时功耗可以减少55%,更好地满足5G URLLC和eMBB对边缘数据中心转发能力的特殊要求。

实际混合业务场景测试:在服务器接近满负荷的情况下,大量视频背景流量中混合工业传感控制业务流量,不启用智能网卡加速时,由于流量转发已经到达服务器处理能力,数据包平均转发时延高达260us,部分数据包转发时延超过500us,工业控制也与视频业务无区别对待,二者报文时延一致;当开启智能网卡加速后,工业控制流量时延瞬时下降,转发时延低于80us,降低了70%。

在2019年巴塞罗那世界通讯展上,中兴通讯推出了基于智能网卡加速的5G UPF(User Plane Function,5G用户面网元)产品,并在现场进行业务演示,采用第三方的仪表对5G UPF进行实时测试,其高吞吐量、低时延等指标数据获得了业界的广泛关注与认可。

结论

中兴通讯对两种软硬件加速技术的研究应用,在5G用户面优化方面取得了良好的效果,大幅度提升了虚拟化用户面的吞吐量和时延等I/O性能,使得虚拟化用户面可以满足5G的高带宽低时延的要求,比如车联网,AR/VR等业务场景,从而使5G网络可以采用统一的虚拟化平台,助力运营商打高带宽低时延的绿色节能网络。