摘要: 利用可以隔离控制和转发面板,并使用平稳的重启机制——也被称为思科不间断转发( NSF )——的路由器,可以大幅度地延长网络和应用的正常运行时间。这种软件恢复技术能在出现暂时中断时,利用一个路由处理器保持分组的正常传输,从而最大限度地降低对您的网络的影响。为了实现 NSF , Cisco 12000 、 10000 和 7500 系列路由器可以采用常用路由协议——包括边界网关协议 [被屏蔽广告]( BGP )、中间系统-中间系统( IS-IS )和开放最短路径优先( OSPF )的新型平稳重启扩展。本文将详细介绍思科 NSF ,包括 NSF 的基本运行步骤和路由协议的平稳重启交换。
关键词: BGP , Cisco 12000 系列路由器, Cisco 10000 系列路由器, Cisco 7500 系列路由器, Cisco 7300 系列路由器, Cisco IOS® 软件,思科 NSF ,平稳重启,高可用性网络, IS-IS ,网络永续性,不间断转发, OSPF ,路由处理器,路由
深入阅读
•
图 1: 支持思科 NSF 的对等路由器可以帮助彼此从突发故障中迅速恢复,从而最大限度地缩短停机时间、继续转发分组和保持整个网络的稳定性。
图 2: 无论采用任何协议,用户数据分组都将在整个恢复步骤中不断地在对等路由器之间传输。
平稳重启的基本步骤
所有路由协议的平稳重启步骤都是类似的(如图 1 所示)。下面列出了基本的步骤:
• 确定对等路由器“支持 NSF ”。
• 发送 / 接收重启位,以便对等路由器知道正在进行恢复。
• 暂时保存邻接信息,以便分组可以继续使用最后知道的路由继续转发。
• 在恢复完成之后交换新的路由数据库信息
但是,因为每种路由协议都使用不同的机制来建立路由器的邻接关系或者对等关系,以及交换路由信息,所以每种协议的平稳重启步骤和消息都有所不同(如图 2 所示)。
例如, BGP 利用底层 TCP 协议来建立对等关系,而 OSPF 和 IS-IS 使用 Hello 消息来建立邻接关系。这两种路由协议的另外一个区别是:在发现重启路由器无法恢复和决定重新利用完全网络融合进行传统恢复之前,持续转发分组的时间。
BGP 平稳重启
因为 BGP 重启的影响可能会非常深远,所以 BGP 是进行高可用性改进的重要对象。 BGP 可以承载大量的路由,所以在某个 BGP 软件发生故障后进行网络融合的时间通常长于其他支持较少路由的路由协议。此外,因为 BGP 是一种域间路由协议,所以一个发生故障的 BGP 流程可能会传播到多个网络,而不是局限于某一个域。
在 BGP 网络进行重启时,协议改进会在初始 BGP 连接建立之后开始。重启路由器及其对等路由器会通过在建立进程的初始 BGP OPEN 消息中交换 BGP 功能代码 64 ,表明对思科 NSF 的支持。
在通常情况下,当路由器重启它的 BGP 进程时,与对等路由器的 TCP 连接将被清除,从而导致对等路由器清除所有与重启路由器有关的路由。但是,在进行 BGP 平稳重启时将不会进行这样的操作。相反,对等路由器会将这些路由标为“过期”,并根据对重启路由器将会迅速重新建立 BGP 进程的预期,继续用这些路由转发分组。同样,重启路由器还将在 BGP 协议进行重新融合时继续转发分组。
当重启路由器建立新的 BGP 进程时,它将会再次向它的对等路由器发送 BGP 功能代码 64 。但是在这一次,平稳重启功能交换中的标记位设置将让对等路由器知道 BGP 流程已经重启。
在继续转发分组的同时,对等路由器将向重启路由器发送一个初始路由升级。对等路由器将通过一个 end-of-RIB ( EOR )标记表明它已经将升级发送完毕。这个标记实际上是一个空的 BGP UPDATE 消息。在重启路由器从所有对等路由器收到 EOR 以后,它就知道它可以利用新的路由信息再次开始选择最佳路径。
同样,重启路由器也会向它的对等路由器发送所有升级,再利用 EOR 标记表示发送完成。这将让对等路由器可以用从重启路由器接收到的升级取代过期的路由。
IS-IS 的特性
互联网工程任务小组 ( IETF )正在以互联网草案的形式,为 IS-IS 连接状态、单域路由协议设计一个类似的平稳重启流程。 IS-IS 扩展的设计者、来自思科的 Mike Shand 指出, 在本期 Packet® 出版时, IETF 将会公布这个草案的最后一个版本。如前所述, IS-IS 利用 Hello 协议发现相邻的路由器,以及建立和保持邻接关系。当路由器重启时,它会通过 Hello 协议数据单元中的一个重启请求( RR )位向其对等路由器发送信号。在一个 IS-IS 网络中,对等路由器可以直接向重启路由器发送数据库信息,而无需等待确认消息。
在路由器重启之后,它会发送一个带有特殊的 RR 位设置的 Hello 分组,从而让对等路由器知道它已经重启。对等路由器会通过在它自己的 Hello 消息中设置一个特殊的重启确认( RA )位,确认这个重启信号。在对等路由器知道另外一个路由器已经重启(因而没有任何路由信息)之后,它会发送一个所有连接状态分组( LSP )的汇总列表,随后再发送该列表中指明的 LSP 。另外,一旦汇总列表符合,重启路由器就会升级它的数据库。从这个角度上来说,这种功能与 BGP 平稳重启流程中的 EOR 相当类似。
思科为可以利用命令行界面( CLI )进行设置配置的 IS-IS 提供了另一种方法,即将所有的邻接和 LSP 信息保存或者暂存到备用 RP 中。在切换完毕之后,新的主 RP 将利用暂存的数据保持它的邻接关系,并可以迅速地重建它的路由表。
RP 的切换过程只需要几秒钟时间。 IS-IS 可以在接下来的几秒钟内重建它的路由表,并与网络重新同步。在这个时候, IS-IS 会等待一段指定的间隔,随后尝试第二个思科 NSF 重启。在此期间,新的备用 RP 将会启动,并将它的配置与主 RP 保持同步。
在同步完成之后, IS-IS 邻接关系和 LSP 数据会暂存到备用 RP ;但是,只有在间隔时间结束之后, IS-IS 才会尝试新的思科 NSF 重启。另外,重启路由器将会用第一个汇总列表验证它所缓存的 LSP 的有效性,从而保持 IS-IS 协议的状态。
OSPF 的工作方式
当某个支持 OSPF NSF 的路由器进行 RP 切换时,它会执行两项任务,以便与它的 OSPF 邻居重新同步它的连接状态数据库( LSDB )。首先,它必须在不重新设置邻接关系的情况下,重新学习网络上的可用 OSPF 邻居。其次,它必须重新获得网络的 LSDB 的内容。
在 RP 切换之后,重启路由器会以很短的间隔时间,向支持思科 NSF 的相邻设备发送一个 Hello 分组,并在其中的扩展选项类型长度值( TLV )中设置重启信号位。对等路由器将意识到,与重启路由器的邻接关系不需要重新设置。在重启路由器收到一个 Hello 响应(作为对它的 Hello 消息的回复)之后,它就会开始与它的对方路由器进行数据库同步。
在数据库同步结束之后,重启路由器将会升级它的路由信息库( RIB )和转发信息库( FIB )。如果网络或者连接状态信息与重启路由器在数据库同步期间收到的信息不同,重启路由器将会把这些信息发送到对等路由器。
-----------------------------------------------------------------------------------------------------------------------------------------------
高可用性网络必须在很多方面进行加固,包括采用冗余的网络拓扑设计。此外,还需要部署配有冗余组件和软件智能的路由器。这些软件智能可以进行故障恢复和减轻暂时中断对网络的影响。
很多思科路由器都以路由协议扩展的形式支持内部设计和软件智能,因而可以帮助服务供应商和企业加固它们的网络。
JAYKUMAR THONTAKUDI 是思科集中营销部门的一位技术营销工程师,精通面向企业和服务供应商网络的 IP 路由和网络永续性。他的电子邮件是 jthonta@cisco.com 。
计算路由器的正常运行时间
系统的可用性是通过路由器的平均故障间隔时间( MTBF )——即设备正常工作的总时间——和平均故障恢复时间( MTTR )衡量的。 MTTR 表示系统不能处理和转发分组的时间。用 MTBF 除以 MTBF 和 MTTR 之和,再乘以 100 ,就得出某个特定系统的可用性百分比。
- 推荐阅讯
- 微软发布Beta3测试版IE7 试图解决安全问题
- Firefox出现新高危0Day漏洞
- IE典型故障解决大全
- 微软对IE进行200多处修改 提高CSS支持程度
- Cisco路由器端口故障的解决办法
- Mozilla Firefox和Mozilla之间有什么不同
- 决战紫禁巅 IE 7对决Firefox 2.0
- Opera for Windows 9.0 Beta Build 8406
- 让ACDSee“下岗” iSee个人图片评测
- 插件:网页图片刷新工具下载
