让路由器永不停顿


假如一个路由处理器发生故障,会出现网络中断吗?不一定 。当网络设备由一次察觉不到的中断故障中恢复时,那么网络就没有中断,因为就最终用户而言,既没有发生中断,也没有出现停机 。但是,即使在一个路由处理器真地发生故障时,人们设计的两种新软件特性仍可以保持边缘路由器的完整性,这两种新软件特性就是状态性转换(SSO)和不间断转发(NSF) 。
状态性转换使一个热备份路由处理器可以在接管发生故障的路由处理器的同时,保持连接性 。SSO还保证网络治理系统可以像治理一个系统和一个可治理实体那样,治理一台配置两个路由处理器的设备 。
在采用SSO的情况下,现用路由处理器和备份路由处理器监测现用路由处理器到备份路由处理器的ATM、帧中继和以太网连接,来保持第二层数据链路连接信息 。保持这种连接是降低CPU使用率、减少转接过程中数据丢失量和迅速建立热备份状态备份路由处理器所必须的 。
此外,由于Internet上的路由器保持着它们可能需要连接的其他几万台路由器的连接信息,任何建立SSO环境的方法还必须能够扩展到几万个接口 。要想做到这点,就必须只保持必要的连接信息和不能跨路由处理器重建的连接信息 。跨路由处理器保持的状态的例子包括物理接口状态、永久虚拟电路状态和命令同步状态 。
在发生故障时,SSO将系统切换到热备份路由处理器,出现故障的路由处理器将尝试重新引导并作为新的备份路由处理器运行 。这种切换是在不重新引导线路卡的条件下完成的,因此,没有造成可能会引起连接协议中断的线路切换 。
SSO过程的每一个步骤都通过SNMP受到监测,它通知网络治理人员这里发生了路由处理器故障 。这点非常重要,因为由于用户的应用从未出现中断从而不会向网络运营中心报告故障 。SNMP陷阱告知网络治理系统故障的原因和出现故障的路由处理器是否能重新引导 。假如不能的话,路由处理器就需要被更换,更换路由处理器的工作可以在不关闭这台路由器的情况下完成 。
不间断转发功能保证IP包在SSO过程中不间断地转发 。试图保持跨两个路由处理器上的所有路由表状态是不实际的,因为路由表可能具有10万到20万个路由项 。因此,IETF提出了协议重新启动扩展方案,使边界网关协议(BGP)、IS-IS协议以及开放最短路径优先协议(OSPF)具有了不间断转发功能 。这些扩展方案使发生重新启动情况的路由器与所有对等路由器之间的第三层关系得以保持,并且不必保持路由处理器之间的任何状态,因此消除了可伸缩性问题 。
当两台路由器构成对等关系时,它们相互交换容量 。由于发生故障的路由器可能甚至在连接协议中断连接前就恢复了,因此添加的新容量 包括警告对等路由处理器不从数据库中删除发生故障的路由器 。这些新路由协议扩展使一台重新启动的路由器可以在恢复时通知对等路由器,可以请求重建路由表所需的信息,并且在使用BGP时,可以重新在对等路由器之间建立TCP会话 。

    推荐阅读