- 现代卫生信息技术与应用
- 陈敏 周彬 肖兴政主编
- 1503字
- 2021-04-16 15:43:05
第七节 可靠性技术
一、设备可靠性
(一)整机双器件备份
IP承载网设备的可靠性主要体现在设备的体系结构设计和软硬件平台,一般先进的路由器体系结构需达到以下四方面的要求:①路由与交换分离。提供高速转发能力,业务与性能并重。②分布式交换。提供无阻塞的交换能力,扩展性好。③冗余交换网架构。确保设备无中断转发。④全冗余备份。关键部件全冗余,如采用双电源、双主控。
路由器的逻辑架构包括数据平面、控制管理平面和监控平面等。数据平面完成数据报文的高速处理和内部无阻塞交换,包括报文的封装与解装、IPv4/IPv6/MPLS转发处理、QoS与调度处理、内部高速交换以及各种统计。控制管理平面完成系统的控制管理功能,是整个系统的中枢神经系统。控制管理单元完成的功能包括协议和信令的处理、系统状态的配置与维护管理、系统状态报告与控制等。监控平面独立完成系统的环境监控,包括电压检测、系统上下电控制、温度监测与风扇控制等,以保证系统的安全稳定运行。出现单元故障时,将及时隔离故障,保障系统其他部分的正常运行。
(二)故障倒换无间断转发
核心路由器主控单元采用冗余备份技术,在主控单元倒换期间,相邻网络设备将中断原有连接关系,导致数据包无法继续转发,引起业务中断。NSF-GR联动、NSR和ISSU等技术陆续出现,这些技术在主控单元倒换或软件升级期间,保持业务转发不中断。
1. NSF技术
不间断转发(non stop forward,NSF)是指在路由器控制层面故障时,数据转发可不间断正常执行。通常路由器故障后路由协议层面的邻居将检测到它们的邻居关系Down掉,过段时间再Up,此过程称为邻居关系震荡。这种震荡将最终导致路由震荡,使重启路由器在一段时间内出现路由黑洞或导致邻居将数据业务从重启路由器处旁路,导致网络的可靠性大幅降低。不间断转发技术的目标是解决路由震荡问题,NSF作为一种可靠性技术有一定的局限性,需要邻居路由器同时具备GR-Aware能力,此外若重启路由器的邻居路由器同时发生重启,则NSF无法实现,即存在重启并发问题。
2. NSR技术
不间断路由(non stop routing,NSR)技术使路由器达到高可用性,使主控卡切换时可不中断路由、不中断转发、不中断业务,同时邻近的路由器不受任何影响。该技术比传统的NSF+ Graceful Restart方式具有更好的系统可用性和可操作性,实现不中断业务功能,保证路由器主备控制卡的平滑切换,对邻居路由器没有影响,无需路由协议扩充,实施简单易行。NSR技术要求主控板1+1冗余,正常工作时主用板卡将路由信息和状态信息同步给备用板卡,主用板卡故障时备用板卡快速接管路由工作,保证数据报文转发不受影响。NSR技术为设备内部实现,不涉及协议扩展。
GR技术需要路由器之间配合,NSR设备无须路由器之间配合,由设备自身完成保护,如图1-4-27所示。
路由器应支持相关网络协议,如OSPF (RFC3523)、IS-IS(RFC3847)、LDP(RFC3478)等NSF和NSR技术。NSF和NSR技术均可用于市局核心路由器,保障本设备在主备倒换时不丢包,NSF需依赖邻居路由器也支持同样的NSF特性,NSR则对邻居设备无要求。
(三)部署ISSU软件,保持升级无间断
网络核心设备需定期升级软件版本,同时保证医疗网业务应转发不中断,尤其在部署单台设备的场景中,升级版本需较长时间(可能超过1小时),该时间段内设备覆盖的用户终端将出现网络故障,因此需要实现不中断业务升级(inservice software upgrade,ISSU)。升级初始状态时需要设备存在主备板,主备板均运行老版本,主要过程是:上传和升级备板为新版本,此时主板依旧为老版本运行并引导流量转发;在主控板上传新版本,备板上传新版本并重启,此时备板运行新版本;GR主备倒换,此时主板重启,备板升级为主板并引导流量转发,其间实施GR倒换接口板FIB转发表不变,保证流量不中断。原主板重启后变为备板,且启用运行新版本系统软件。整个过程中主备板均升级为新版本,升级过程中设备继续保持业务转发不中断。
图1-4-27 GR和NSR