光互联网的核心路由交换技术

光互联网的核心路由交换技术
核心路由器市场是通信市场上增长最为迅速的部分,在短短的几年内就飚升至数十亿美元的市场规模。Internet带宽需求和光带宽的指数式增长,特别是由于密集波分复用(DWDM)的使用,将核心路由器市场置于极大的挑战中,这也是Internet基础设施的建设者要为用户提供高速应用所必须面对的挑战。

复杂的交换和路由处理需要电子器件。但随着光纤容量、用户数、应用类型以及每种应用对带宽的需求等等方面都成指数增长,尽管电子器件的处理速度继续以摩尔定律增长着,但仍然不能跟上带宽需求和光纤容量的增长。过去使用的交换和路由系统,即使升级也无法满足Internet现有的和未来的带宽需求。因此需要采用新的方法来应对挑战,以合理的单位端口造价支持成百上千的高速端口(OC-192)。交换和路由系统的核心是交换矩阵,它负责输入端口和输出端口流量的透明互连。本文考察了变化的市场对核心路由器的要求以及核心路由器所需要的新交换结构。

核心路由器的要求

曾经是基于软件的路由器现在则是采用硬件来实现。这个转变使得路由器制造商在过去的几年里将路由器性能提高了好几个数量级。但是,这些进展仍然远远低于Internet不断增长的带宽要求。如今所说的T比特级路由器实际上是G比特级路由器,运营商们今天实际上实施的方案的无阻塞交换容量多数只能达到20G到80Gb/s的最高速率。

借助于DWDM技术,光纤的带宽几乎是无限的。每根光纤上所能传送的光波长数量每年增加一倍,每个波长承载的速率也从OC-12(622Mb/s)增加到OC-48(2.5Gb/s)甚至更高,带宽在光纤传送层突然变得十分充足。但是当DWDM在九十年代将光纤带宽扩大一百万倍时,电子器件的带宽同期只增长了仅仅100倍。结果就造成了光带宽和电带宽的巨大差距。

Internet需求的增长使业务接入点(POP)的带宽需求每年增加5倍。在过去3年里,这相当于增长了125倍;到2001年,这将使Internet POP带宽需求超过4Tb/s。交换机的结构对于使可扩展路由方案满足容量需求是关键的。可供选择的交换机结构主要有两大类:单级结构和多级结构。

单级交换结构

目前,核心路由器使用单级交换结构,四个主要结构是:总线、环、交叉和共享内存结构。

总线结构,所有端口共享一个通用总线。为了实现无阻塞,总线结构的工作速度必须是链路速率的N倍(N是端口数)。输入端口负责以总线全速率向总线上写数据,特别是以菊花链的方式进行。对于单播业务,每个信元只寻址到一个输出端口,每个输出端口必须在每个信元周期准备好进行信元接收,因为每一个输入端口都可能会把信元送到同一个输出端口(这种输出的过载是短期的,不会持续很长时间)。总线结构的大小和速度根本上是受高速总线制造技术和N端口驱动技术的限制。

在环形结构中,每端口通过一个接口共享环路带宽。输入端口将信元送到环上,采用适当的环竞争策略(如令牌技术)来控制接入。与总线类似,每个输出端口必须在每个信元周期内做好接收信元的准备,环速率必须是链路速率的N倍。但是,由于每个环接口可以再生信元数据,因此可以支持更高的速率。

另一种结构是交叉结构,可以一次同时传送多个信元,每路信元的速率比总线或环形结构的要低。一个交叉结构由N×N交叉矩阵构成。当交叉点(X,Y)闭合时,信元就从X输入端输出到Y输出端。在典型情况下,信元的传送是周期性的。通常是通过一个*控制表来调度每个周期的信元传送,以确保以最大的速率传送信元而不造成碰撞。系统还必须包含*控制表的备份,因为它代表一个故障点。调度程序必须高速工作,这也是一个挑战。

最佳调度算法的复杂度为N的3次方,这限制了其速度。交叉结构要求交换机的输出和输入端口进行排队,一个端口一个队列。由于每个队列是独立的而且必须要设计得能容纳最坏情况下的流量冲击,因此总队列存储器是很大的。

共享存储结构,通过共享输入输出端口的缓冲器,从而减少了对总存储空间的需求,而且存储器的容量只决定于最坏情况下的全部流量需求。但是,共享存储结构需要一个机制将信元从输入端口送入存储器以及从存储器送到输出端口。为了使共享最大化,任何时候、任何输入/输出端口均应可以接入每个存储区域,一般需要两个交叉矩阵:一个在输入端口和总存储器之间,一个在总存储器和输出端口之间。因此,它需要两倍的逻辑处理能力。

当考虑大型系统时,单级交换结构有两个基本问题。第一、对于小规模系统,每端口成本还算合理,但随着规模的扩大,其成本涨得也特快。第二、所有的单级交换结构在技术上受限于其尺寸与速度。一旦达到这些极限,单级交换机无法再增加端口或提升线路速率。正因为如此,可扩展的交换系统必须采用多级结构。

多级结构

多级交换结构是由多个交换单元互联起来的,每个交换单元具有一整套输入输出,与普通交换机类似,提供输入输出的连接。但是,交换单元的输入输出端口数较整机交换机少,这样就可以采用现有的技术来制造。通过互联多个小的交换单元,就可以制造一个大型的、可扩展的交换机。多级结构之间的不同取决于交换单元之间是如何互联的。这里举3种多级结构的例子:Benes、Clos和三维环绕格形结构(3DTM)。

Benes网使用方形交换单元(即:输入输出端口数相同)进行多级互联。一般来说,3级N部Benes网的每一级均可以用N个输入/输出端口和N个交换单元来构造。这个格形结构在每个输入端和每个输出端之间形成N个可能的通路。Benes输出可以扩展至任意奇数级。

Clos网是Benes网的推展,用非方形交换单元构造。交换单元的互联与Benes网的样式相同。在3级Clos网中,Clos网在输入级有d×r个交换单元,中间级有N/d乘N/d交换单元,输出级有r×d交换单元。增加r将增加输入和输出间的通道数量和减少每通道所需的带宽。但是,网络总带宽(即成本)与r的值无关。Benes网的配置取r=N/d,即方形交换单元,是一种较便于实现的方案。

3DTM网用大小固定的交换单元互联而成。每个交换单元被连成一个三维环绕的格形网。每个交换单元通过单向或双向链路与它的6个相邻节点相连,并具有一个双向外部链路。路由选择时要求在每个方向上分别经过若干转接点。在任一方向上的平均转接点随端口数的立方根比例增长。要实现无阻塞,系统的成本差不多与N4/3成正比。

虽然对于小型系统单级结构的设计相对简单,成本也相对低,但是它不能满足下一代Internet扩展的需要。多级结构在操作上较复杂,但是可以扩展到成百上千个端口,这对于下一代Internet核心路由系统是绝对必要的。在多级拓扑结构中,Benes结构是最佳选择,因为它的系统复杂程度最低,性能好且满足可扩展的要求。