APP下载

基于堆叠技术实现核心交换机冗余设计探究

2020-07-06朱新义

中国新通信 2020年3期

朱新义

摘要:在互联网网络技术数据中心技术及网络虚拟化技术持续发展与更新的背景下,网络的工作模式发生了非常深刻的改变。多媒体技术的应用对提升工作效率,改进用户体验,完善系统性能均具有非常重要的意义。本文尝试研究一种基于堆叠技术的核心交换机设计方案,对交换机堆叠的基本概念进行分析,并就交换机堆叠的性能、可靠性、可维护性及发展趋势展开研究,仅供各方参考。

关键词:核心交换机;冗余设计;堆叠技术;转方面堆叠;控制面堆叠

一、交换机堆叠

交换机堆叠是指将两台或多台交换机的虚拟成一台交换机,与集中式控制一样,对外呈现出一个控制面,一方面能够在空间有限的前提下提供尽可能充分的端口支持,增加系统交换带宽,另一方面通过一个控制平台下发全局成员的配置,便于网络的管理维护。在交换机堆叠相关性能指标中,最大可堆叠数是指一个独立堆叠单元中可支持的组合交换机数量最大值,它代表一个堆叠系统所能提供的最大端口密度。目前技术条件支持下,按交换机组网的拓扑来分,第一是链式堆叠,多台交换机组成一个链,为了提供网络的可靠性,也可以组成环形堆叠;第二则是星型堆叠,目前多见于端口密度较高且效率要求较高的局域网网络中。按交换机的业务层面来分,又分为控制面堆叠,即有系统主管理所有成员设备的加入、退出等;与控制面对应的是转方面堆叠,由主设备管理各成员设备的转发业务,如主设备进行转发拓扑计算并下转发表。通常说的堆叠是指转方面与业务面都组成堆叠,堆叠管理链路与堆叠转发链路可以合一,也可以分开。如果仅仅转发面堆叠,控制面不堆叠,通常叫mlag。为了适应数据中心的组网拓扑,有演化出混堆,即spine-leaf模型,spine即父节点,可单台,也可以多台交换机组成堆叠,下挂leaf节点。

二、堆叠实现原理

先介绍几个堆叠的背景知识,堆叠成员设备根据堆叠角色分为系统主,堆叠系统的管理者;系统备,系统主退出后升系统主;系统从,即成员设备,系统主设备与系统备设备都退出后,成员设备重启。堆叠端口,很多厂商都实现了灵活堆叠,不用专门的堆叠模块,用于堆叠的端口也是普通的端口,需要做工作模式切换,当被用作堆叠口时则将该端口配置为堆叠端口模式。插在堆叠端口上的光模块线缆也是普通的光模块与线缆,将普通口配置为堆叠口,插上线缆,就可以组建堆叠。管理报文的优先级高于业务报文,所以就是出现广播风暴,管理报文也不受影响,堆叠报文与业务报文一起转发没有可靠性问题。

以华为的数据中心交换机设备为例,介绍下交换机堆叠实的现原理。对于盒式备堆叠,管理通道与转发通道是合一的,也就是说管理消息与业务流量承载在相同的链路上。堆叠建立过程与通常的网络协议一样,相邻设备基于堆叠端口互发链路探测报文;探测到链路后再基于堆叠逻辑口互发邻居发现报文;邻居发现后再堆叠系统内部成员设备发送堆叠竞争报文,成员设备收到优先级高的竞争报文则自己停止发送竞争报文,最后只有系统主发送堆叠竞争报文;系统主再选一个成员设备作为系统备。

框式设备的堆叠又分为带内堆叠与带外堆叠。带内堆叠就是管理报文承载在转发通道,也就是管理通道与转发通道合一,反之就是带外堆叠。盒式设备都是带内堆叠,框式设备由主控板、网板及转发板等单板组成。主控板是整框的管理者,堆叠主要部署在主控板上。框式设备的带内堆叠缺点多,如由于依赖业务板,堆叠建立特别慢,可靠性差,应用相对较少。只有交换机距离太大才会用到。带外堆叠,根据前面的概念介绍,自然就是有专门的管理通道。这个时候管理通道与转发通道分别建立堆叠,管理通道确定最终的成员设备信息,转发通道要与管理通道保持一致。

为了适应数据中心的三级网络模型,即接入层、汇聚层与核心层,演化出混堆技术。其中又分框式混堆设备与盒式设备混堆。性能较低的设备部署在接入层做leaf;性能较强的设备部署在汇聚层做spine。混堆建立的过程与堆叠类似,但是leaf设备不需要发送竞争报文。为了提高系统的可靠性,一台设备故障了也不影响其他设备还能有堆叠的优点,就有了控制面不组建堆叠,仅仅转发面组建堆叠mlag技术。

三、堆疊技术分析

堆叠技术的优点分析,不改变硬件的前提下实现扩容,一般盒式设备堆叠都能支持9机堆叠。比如36个40GE端口的设备,一台设备转发带宽1.44T,9机堆叠接近13T,具体还看网络规划中横向流量大小,预留多少带宽。框式设备支持2台设备堆叠,带宽基本扩大一倍。管理方便,整个堆叠系统共用一份配置,不需要对每台设备都下一次配置;维护也方便,比如升级,一次升级一个系统,不用逐台升级;混堆的时候,只需要升级spine的版本。

堆叠技术的不足,增加系统延时,比如9机堆叠,即便环形堆叠,系统主将转发表下发到最远的成员设备上,要经过4跳,势必会导致时延大、流量切换性能差。所以用得比较多的还是双机堆叠或四机堆叠。

堆叠技术同时也会降低系统的可靠性,多级堆到一起时,带宽翻倍,可靠性也是成比例降低。堆叠设备间耦合大,不同的业务特效耦合也很大,实现复杂,容易出问题。比如电信级的设备可靠性要求是5个9,稳定性要求很高,不太会用9机堆叠。中间一台设备异常复位或链路故障,成员设备联系不到系统主,就会导致设备重启,高可靠性场景下,核心交换机堆叠应用要慎重。

Mlag技术只对转发面堆叠,所以不会一台设备故障而影响另外一台。不仅能对带宽扩容,而且还能提高设备的可靠性,应用得非常广泛。Mlag只支持两台设备,所以用于双活备份场景。

四、结束语

本文上述分析中尝试引入堆叠技术对核心交换机进行冗余设计与实现,并对各类故障状态下核心交换机的冗余性能进行研究与分析。与传统基于路由器的交换机冗余方案对比,基于堆叠技术的核心交换机冗余性能更为确切,大幅度提升了数据吞吐量;堆叠系统共用一个控制面,通过一台设备管理整个堆叠系统,配置是在堆叠系统内全局有效,大幅降低了设备的管理与运营成本。

参考文献:

[1]陶恒韬,陶智勇.基于ISS堆叠系统MAD机制的设计与实现[J].自动化技术与应用,2020,39(1):70-73,113.

[2]吴智理,曾彪,鲁旭蔚, 等.基于堆叠技术的放疗网络系统改造和升级[J].医疗卫生装备,2016,37(3):65-67,83.