AR46系列路由器之--高性能重新演绎

随着信息化进程的加快,各企业用户由于运行环境、业务特点等不尽相同,其网络组网方式也是千差万别,对路由器产品的业务需求也越来越多、越来越复杂--除了传统的ACL、NAT、桥、DLSw、组播、备份等路由器特性以外,新一代企业网核心路由器还必须在QoS、MPLS、多种方式VPN(L2TP、GRE、IPSEC、MPLS VPN)、DCC、语音等特性方面均予以充分支持,这给企业网核心设备--路由器带来了新的发展机遇和挑战 。
目前,有些路由器存在这样一种现象--跑转发时的测试性能很高,基本能达到200-300Kpps,即大约200MHz的端口吞吐流量;但启动防火墙、NAT、QoS等业务时,性能损失却非常厉害,一般都会下降一半以上 。
产生这种现象的主要原因在于企业网路由器采用的集中式转发体系架构存在一些固有的缺陷 。首先,由于集中式处理系统具有天然的成本优势,因此企业网路由器普遍还是采用单CPU系统、各单板共享系统总线的集中式处理架构 。
图1 传统的集中式路由器系统架构简单示意图
如图1所示,1、2、3分别代表三条不同的数据流转发路径 。很明显,系统的主要瓶颈在于CPU的处理能力和共享总线的性能 。其中CPU的处理性能主要与CPU主频和体系结构有关,共享总线一个非常大的问题就是效率不高 。一方面,数据转发要经过两次总线,导致总线带宽浪费;另一方面,各单板对总线的争夺带来额外的开销,非凡是单板数量较多时,这种竞争关系会越来越严重 。比如说,对于目前企业网路由器中广泛采用的PCI总线来说,理论上带宽为1Gbps,但实际可利用带宽只有30%左右,即300Mbps 。小包时,性能更低 。
一般而言,当系统中所有环节都是瓶颈时,系统设计是最优化的 。因此,多数厂家在进行设计时,CPU的性能与总线设计和路由器的规格是基本相当的(如100-200Kpps转发性能的企业网路由器,一般采用一条PCI总线,CPU主频在200-300MHz左右),此时系统的瓶颈在于系统总线和CPU 。当然,这只是转发时的性能测试情况 。
由于路由器系统的负载并不是一直平衡的,一旦路由器启动防火墙、VPN、NAT、 QoS等业务,CPU将成为要害瓶颈所在--假如CPU性能不能满足这些业务的处理要求,系统性能将有一个很大的下降,一般都会损失一半以上的性能(我们平常在产品广告上看到的路由器性能实际上为转发性能,都是不带业务情况进行测试的,并不能反映带业务处理能力) 。
Quidway瓵R46系列路由器在初开发阶段就定位为新一代企业网核心路由器,设计时充分考虑了带业务时对路由器性能的影响--为规避CPU的瓶颈,Quidway瓵R46系列路由器采用更高性能的PowerPC RISC CPU,主频达到733MHz,处理能力一下提升到业界同类产品的三倍左右 。这样,路由器在处理各种复杂业务时就具有足够的处理能力,确保了启动复杂业务时保持100M、155M等接口的线速转发 。
另外,为有效降低各单板对总线的竞争所带来的性能和效率下降,Quidway瓵R46系列采用了独特的系统双总线架构,即CPU通过交换式系统芯片驱动两条独立的PCI总线,这两条总线之间完全独立,各提供1Gbps的理论系统带宽,与CPU和内存之间的互连采用无阻塞交换式架构,这样既确保了各接口单板与系统的高速通道,也保证了路由器带多个业务接口单板的能力 。
图2 AR46系统架构示意图
华为3Com Quidway瓵R46系列同时在系统芯片上直接引出两个固定的FE端口,这两个FE口也是通过交换架构与CPU和内存之间进行互连,不存在总线瓶颈,从而确保了线速转发 。目前,Quidway瓵R46系列路由器可达到350Kpps(155M端口线速转发),并可做到启动复杂业务时,转发性能不下降,远远高于业界主要的竞争产品 。

推荐阅读