二、技术架构

(一)有线无线融合技术架构

Cisco Catalyst 3850是首个可堆叠访问交换平台,可在基于Cisco IOS XE软件的单一平台上提供有线与无线服务。思科利用此功能率先推出了一系列以无缝方式跨有线与无线工作的丰富功能,如基于堆叠上状态切换的高可用性、精细QoS、安全性和Flexible Netflow。有线与无线功能捆绑到单一的Cisco IOS软件映像,减少了用户在其网络中启用映像前需确认/证明其资格的软件映像数量。命令行界面的单控制台端口管理减少了管理无线与有线服务所用的接触点数量,降低了网络复杂性和管理基础设施总体拥有成本,同时简化了网络操作。
有线与无线的融合不仅提高了网络中的无线带宽,还扩大了无线部署的规模。每个48端口Cisco Catalyst 3850都提供40Gbps的无线吞吐量,容量随堆叠成员数量的增加而增加,确保网络的可扩展性,以支持基于IEEE 802. 11n的接入点等无线带宽要求,同时支持IEEE 802. 11ac等未来无线标准。
Cisco Catalyst 3850可分配无线控制器功能,实现更好的可扩展性。每个Cisco Catalyst 3850交换机/堆叠都能在移动代理和移动控制器模式下作为无线控制器工作:①移动代理是Cisco Catalyst 3850交换机供货时的默认模式。在此模式下,交换机能从接入点终止CAPWAP隧道,并提供至无线客户端的无线连接。同时可执行维护无线客户端数据库、配置和实施无线客户端及接入点的安全性和QoS策略。无需在IP Base上使用其他许可。②移动控制器模式下,Cisco Catalyst 3850交换机可执行所有移动代理任务,还能在移动子域内进行移动协调、无线资源管理和Cisco CleanAir ®协调。启用移动控制器模式通过交换机命令行界面。Cisco Catalyst 3850交换机充当移动控制器时,需IP Base许可级别。在大型部署中,位于中心的思科5508无线LAN控制器、思科无线服务模块2控制器(运行AireOS 7. 3版时)和无线LAN控制器5760也可发挥此作用。
通过位于配线柜中的移动代理,每个交换机可提供40Gbps的无线带宽,同时移动控制器用于管理部分中心无线功能,通过二者的结合,融合基于接入的无线部署可提供业界一流的无线可扩展性,显著提升无线吞吐量。

(二)节能环保技术架构

Cisco ®EnergyWise是一个全新的能源管理架构,使IT运营和设备能测量和精确调整能源使用,以显著降低成本。EnergyWise是一个内嵌在思科交换机和路由器中的新功能,为思科网络连接的终端设备提供了通信和控制能力,通常在工作站上利用安全的通信管理网络组件工作。
EnergyWise架构充分利用网络来分发命令,发现设备和汇总网络中所有设备的功耗信息,架构如图2-3-1所示。EnergyWise架构中包括类别和功率水平、实体、域、管理通信、管理应用软件和API、查询和数据等属性或服务。

1.类别和功率水平

各种设备需一种通用方法来描述标准功率水平,以便能了解睡眠模式或备用模式等,以及它们相应的功率水平。EnergyWise定义工作、备用和非工作等类别,并进行了彩色标记,在0级和10级之间对应于断电到满功率范围。

2.实体

实体是与网络相连的耗电设备或系统,可以是网络交换机或端口,每个实体都有自己唯一的ID,有母-子实体关系。交换机是所有与其相连的子实体的母实体,交换机的母实体可以都是PoE端口。IP电话和EnergyWise兼容PC等交换机连接设备也能作为交换机的子实体。实体间为邻接设备,邻接关系为清除命令发送和控制信息而设计,而母实体和子实体则用于控制电源。
图2-3-1 三层EnergyWise架构

3.域

为将EnergyWise扩展到大型部署,实体都加入一个域,即包括支持EnergyWise实体的一个逻辑组,域中所有实体都可被看作一个耗电设备。因为域结构提供的电源管理规模和简便性就像是在单一交换机上管理汇聚电源一样,IT也能管理交换机域或网络的功率。为简化域的建立,EnergyWise提供了一个实体发现特性,能自动发现EnergyWise兼容设备。

4.管理通信

EnergyWise在建立域后定义了通信网络,可在实体和电源管理软件间传输控制和命令信息流。通信管理有两种方法:①利用交换机上的SNMP充分发挥现有网络管理应用软件的作用。向后兼容SNMP能使网络管理供应商参与电源管理。EnergyWise为EnergyWise数据以及Energy-Wise命令和控制信息定义了一套MIB。使用SNMP的“get and set”限制管理某个交换机的实体而非一个域。②在域中的交换机上激活一个新定义的EnergyWise management port管理整个域。通过此管理端口,IT可向交换机发布命令和查询,将从整个域检索信息。因此通过单一电源管理控制台能向许多实体发送单一查询或命令,并接收到它们的功率水平或重设其功率水平。

5.管理应用软件和API

现有网络管理应用软件使用SNMP和EnergyWise MIB能向一系列可管理设备添加电源管理功能。全新第三方合作伙伴和应用软件将使用一个专为EnergyWise管理端口设计的管理API,达到适当的范围和规模。管理API能访问整个域,获取功耗和设备效率信息以及位置信息。管理API的运行方式类似于对ODBC服务器进行SQL查询(除该网络就是ODBC数据库外)。因此可在整个域或多个域中执行查询,管理应用软件将整个域看作一个数据库并将这些数据转化为信息,根据用电量对实体和域进行彩色编码图形化标记,体现出效率和地点,简化功耗,优化识别能力。

6.查询和数据

部署上述架构后,IT运营机构能从中央地点向分布于广大地理范围的实体发送丰富的查询。如上所述,实体按类别、母-子关系和邻接关系分类,并被指定用于运行的角色、名称和重要性级别。EnergyWise中可用的命令和控制类型包括用电量等查询、删除子实体等,这些查询能发送给特定类别的设备,将所用功率和时间段数据发送回管理应用软件。支持总耗电量和“如果那么”假设,以便能在发出功率水平更改命令前对其评估。

(三)自定义网络技术架构

SDN是由美国斯坦福大学提出的一种新型网络创新架构,其核心技术OpenFlow通过将网络设备控制面与数据面分离开实现网络流量的灵活控制,为核心网络及应用创新提供良好平台。
2013年1月爱尔兰的Intune网络公司宣布推出业界第一款支持SDN软件控制网络的分布式交换机,是真正首个推出SDN交换机的供应商。Intune在iVX8000系统中增加了SDN支持,后来Juniper推出EX9200可编程核心交换机,它是针对10G、40G和100G的SDN交换机。此后开始进行SDN管理器的发货,迅速完成SDN从控制器到网络设备的实现部署。思科公司也没有停止完善SDN技术,网络巨头惠普在2013年Interp大会上推出多款数据中心交换机产品,支持几乎所有的数据中心新技术。其中S12900就是SDN交换机,完全支持SDN,并在2013年1月推出了SDN控制器产品。
超云在2013年推出国内首款采用SDN架构的交换机SDN620,是可提供一个有着通用数据模型的开放构架,象征着曾经构建网络所需要的机械设备现在能以抽象化方式完成。盛科发布V350 Open-Flow交换平台,基于自有以太网芯片实现了SDN功能。华为推出S12700系列敏捷交换机,是华为首个支持SDN的交换机。
SDN交换机的陆续推出是SDN技术发展中的重要里程碑,但还未完全得到市场的认可。参考传统的网络转发设备,SDN交换机在具体的设计和实现中还需对交换模式、背板设计、缓冲机制、数据转发等多方面技术进行合理选择。

1.交换模式

SDN交换机的数据交换模式决定了其转发数据包的速度及交换过程导致的延迟。SDN交换机的数据交换模式有直通、零碎片、存储转发等多种选择。

(1)直通(cut-through):

交换机仅接收和分析数据帧的前6个字节信息,并将数据帧的其余部分直接剪切到出端口。直通模式具有最小的转发延迟,但并不检查数据完整性,可能转发以太网冲突的“坏包”,产生网络可靠性问题。

(2)零碎片(fragment-free):

交换机首先接收和解析数据帧的前64个字节,再进行转发。选择64个字节的长度是因为在以太网络中,大部分“坏包”都能在这些字节处理过程中被检测。这种模式虽有可能造成极少量的“坏包”漏检,但对网络的整体性能影响小,因此在很多应用场景中被称为快速转发。

(3)存储转发(store-and-forward):

交换机需接收和解析整个数据帧的内容,并开展数据帧的完整性检验等操作,有效避免出现错误。虽然该模式增加了转发延迟,但考虑到当前处理器或ASIC已具有足够的性能,在SDN交换机设计与实现中建议采用此模式用于数据交换。

2.背板设计

从设备入端口接收到的数据包将通过SDN交换机背板发送到设备出端口。交换机的背板是数据帧在交换机内部传输的通信通道,携带有转发决策信息及中继管理信息。
参考传统的网络交换设备,SDN交换机可采用的背板设计主要包括共享总线机制和交叉开关矩阵机制。共享总线(shared bus)机制是指交换机中所有入端口和出端口都共享同一数据通路,并由一个集中的仲裁器负责何时以何种方式将总线的访问权赋予哪个交换机端口。交叉开关矩阵(crossbar)机制又被称作“纵横式交换矩阵”,其基本思路是支持在交换机端口之间提供多个可同时使用的数据通路。

3.缓冲机制

如果SDN交换机采用基于共享总线的背板设计,数据帧需依次等待仲裁器裁决直至对应端口可访问总线时才可发出。即使是采用了基于交叉开关矩阵的背板设计,数据帧也有可能因为网络拥塞被延迟发出,因此相关数据帧需被SDN交换机缓冲直至它被发出。如果SDN交换机没有设计合理的缓冲机制,在出现流量超标或者网络拥塞时,数据帧就有可能被随时丢弃。
SDN交换机的缓冲机制用于解决数据包不能够被设备出端口及时转发的问题,而发生该情况的原因主要包括交换机的设备入端口和设备出端口速率不匹配、多个设备入端口向同一设备出端口发送数据、设备出端口处于半双工工作状态等。为避免发生上述情况导致数据包被丢弃,目前有端口缓冲和共享内存等常用缓冲机制供SDN交换机选择。端口缓冲是指为每个交换机上的以太网端口提供一定数量的高速内存用于缓冲数据帧的到来与转发。共享内存是指为所有端口提供可同时访问的共享内存空间用于端口缓冲。

4.数据转发

在硬件或软件实现的SDN交换机内部,数据帧从设备入端口到设备出端口的传递都需交换机做出转发决策。以OpenFlow交换机为例,通过流表抽象传统二层转发表和三层路由表,使数据包在转发过程中的决策更灵活。

(四)虚拟化技术架构

网络的虚拟化技术主要依托以太网交换机实现,虚拟化技术应用领域包括操作系统、服务器、存储以及网络。自2009年以来以太网交换机的主流供应商都推出了自己的虚拟化解决方案。

1. VSS技术

VSS(virtual switching supervisor)技术是思科公司基于以太网交换机设备的一种网络系统虚拟化技术,功能是将多台思科交换机虚拟为单台交换机。VSS技术使用机箱间NSF/SSO作为两台机箱间的主要高可用性机制,当一个虚拟交换机成员发生故障时,网络无需进行协议重收敛,传输流量不发生任何中断。通过VSS技术可使设备可用的端口数量、转发能力、性能规格倍增,除了单台设备的双控板备份,虚拟化设备之间也有主备-备份关系。VSS技术的使用使交换机更易管理,提高了运营效率,登录虚拟化设备可直接管理虚拟化为一体的所有设备,简化了网络管理。目前只有思科E系列的Cisco Catalyst 6500、N7000等产品和非E系列等高端的设备才支持VSS技术。

2. IRF2技术

第二代智能弹性架构技术(intelligent resilient framework2,IRF2)是H3C网络设备虚拟化技术,第一代智能弹性架构技术IRF1仅解决了接入层的网络结构简化和大量的接入层设备管理维护问题。IRF2可实现端到端的网络结构和管理维护简化,同时可通过机框式设备虚拟化实现全网业务的简化。

3. CSS技术

CSS是华为网络设备虚拟化技术,与VSS和IRF2类似,是将几台交换机通过专用的集群线缆链接,对外呈现为一台逻辑交换机。
供应商都支持虚拟化,但实际却有差异,部分细节对比差异如表2-3-1所示。
表2-3-1 VSS/IRF2/CSS技术对比表
思科VSS、H3C的IRF2及华为CSS的实现细节不同,但最终目的都是将多台设备虚拟为一台设备的技术。VSS使用VSL(virtual switch link),IRF2使用IRF link承载各自的控制平面私有交互协议VSLP和IRF。CSS通过HA心跳技术建立邻接、协商贮备、同步协议状态,3种设备基本都采用10GE的端口完成设备之间的物理互连。

(五)数据中心网络技术架构

随着数据中心对网络设备要求的提升,普通交换机通常无法满足数据中心需要。相比普通交换机,数据中心交换机需具备高容量、大缓存、虚拟化、FCOE、二层TRILL技术等特点。

1.高容量设备

数据中心网络流量具有高密度应用调度、浪涌式突发缓冲的特点,数据中心交换机需具备高容量转发特点。数据中心交换机需支持高密万兆板卡,即48口万兆板卡。为使48口万兆板卡能全线速转发,数据中心交换机只能采用CLOS分布式交换架构。此外,随着40G和100G的普及,支持8端口40G板卡和4端口的100G板卡也逐渐商用,数据中心交换机40G、100G的板卡已进入市场,满足了数据中心高密度应用需求。

2.大缓存技术

数据中心交换机采用分布式缓存架构,缓存比普通交换机大许多,缓存能力可达1G以上。每端口在万兆全线速条件下达到200毫秒的突发流量缓存能力,在突发流量情况下,大缓存能保证网络转发零丢包,适应数据中心服务器量大、突发流量大的特点。

3.虚拟化技术

数据中心的网络设备需具有高管理性和高安全可靠性的特点,数据中心的交换机需支持虚拟化。通过虚拟化技术可对多台网络设备统一管理,也可对一台设备上的业务完全隔离,从而可将数据中心管理成本减少40%,IT利用率提高约25%。

4. FCOE技术

新一代数据中心网络融合趋势越来越明显,FCOE技术的出现使网络融合成为可能,FCOE是将存储网的数据帧封装在以太网帧内进行转发的技术。实现这一融合技术是在数据中心的交换机,普通交换机一般不支持FCOE功能。

5. TRILL技术

数据中心在构建二层网络方面,以前的标准是STP协议,但存在缺陷。TRILL为了弥补STP缺陷,同时为数据中心应用而产生的技术。TRILL协议把二层配置和灵活性与三层融合和规模有效结合,大二层不需要配置的情况下,就可实现整网无环路转发。TRILL技术是数据中心交换机二层基本特性,而普通交换机并不具备。

(六)CLOS多级交换架构

为降低网络建设运维成本,数据中心网络设计者竭力将一个网络模块的规模扩大。同时数据中心网络内部东西向流量也日益增加,在部分集群业务需求驱动下,数据中心网络设计者开始讨论一个网络模块内10 000台千兆线速服务器的可能性。常见数据中心网络模块的典型架构是双核心交换机+TOR接入交换机两级结构,如图2-3-2所示。
图2-3-2 典型数据中心网络模块架构
在大规模数据中心的发展趋势下,数据中心网络架构面临很多挑战,此时出现了CLOS网络架构。CLOS是一种多级交换架构,最早出现于1953年贝尔实验室Charles Clos博士的《无阻塞交换网络研究》论文中,后被广泛应用于TDM网络(多半是程控交换机)。目的是为了在输入输出增长的情况下尽可能减少中间的交叉点数。典型的对称3级CLOS架构如图2-3-3所示。
图2-3-3 对称3级CLOS交换网络
CLOS网络架构是采用一个等价于3级CLOS的部分替代了传统设计的两台核心设备,如图2-3-4所示,架构也可认为是采用一个3级CLOS的部分替代一台核心设备。3级CLOS部分因为汇聚和核心都是双向通信,等价于一个标准的3级CLOS折叠后把输入、输出单元合并。
对称3级CLOS网络的第1级入线和第3级出线均为n,第2级的单元数量为m。为确保链路无阻塞,完成a到b的信息交换,至少还应存在一条空闲链路,即中间级交换单元应有(n-1)+(n-1)+1= 2n-1个,因此无阻塞的条件为:m>= 2n-1,如图2-3-5所示。
图2-3-4 传统网络架构(左)和CLOS网络架构(右)
图2-3-5 对称3级CLOS网络无阻塞条件
Slepian-Duguid定理证明:m = n时,对称3级CLOS网络为可重排无阻塞,可重排无阻塞意味着应对交换网络做端到端的调度。直接证明了CLOS网络中无阻塞的设计,汇聚到核心的带宽应至少是接入到汇聚带宽的(2n-1)/n= 2-1/n倍,但满足m >=2n-1时也无法保证可以避免端到端的阻塞。此时无阻塞的模型前提是入向、出向信息均匀分布,如果分布不均匀就可能导致入向或出向阻塞,这时就需要考虑入向、出向缓存以及加速比的情况。加速比是一种降低输入-输出阻塞的方法。如果一个交换网络可以在一个信元时间内将一个输入端口的N个信元传输至输出,则这个交换网络的加速比S = N。对称三级CLOS架构在无阻塞条件m>= 2n-1时,加速比S=(2n-1)/n= 2-1/n接近2,可重排无阻塞条件m =n时,加速比为1。在加速比为1时,为避免入向阻塞需在交换网络入方向有足够的缓存,此时端到端的延迟将变得不可控或可能非常大,如图2-3-6所示。
图2-3-6 入方向缓存的交换模型,S=1
随着加速比的增加,入方向的阻塞可能性越来越小,出方向的阻塞可能性却越来越大,因此在加速比大于1时,需在交换网络的出方向有足够大的缓存。S=N(N为入方向端口总数)时,仅需出方向的缓存,如图2-3-7所示,此时交换网络的成本最为昂贵,但延迟最小。
图2-3-7 出方向缓存的交换模型,S=N
数据中心网络中可采用商用市场普通盒式交换机搭建胖树CLOS网络架构,实现可扩展、不依赖特定供应商产品的网络架构。但若没有全局集中的流量调度和仲裁机制,也没有全局的入向和出向缓存供调配使用,将难以实现目前市场核心设备的无阻塞转发能力,网络发生阻塞对应用的性能将产生一定的影响。通过适当的加速比选择可减少阻塞。