APP下载

ATCA平台下通信设备管理系统的应用设计

2016-11-22同剑飞

电子设计工程 2016年15期
关键词:状态机中间件网卡

同剑飞

(西安外事学院 陕西 西安 710077)

ATCA平台下通信设备管理系统的应用设计

同剑飞

(西安外事学院 陕西 西安 710077)

通讯行业为保障系统数据处理的高性能,可以采用电信级操作系统和符合ATCA(先进电信计算架构,Advanced Telecom Computing Architecture)规范的硬件平台。本文就如何设计一个面向ATCA平台的电信中间件设备管理系统为研究目的,通过系统冗余和接口的设计,为通信行业的数据处理的高可靠性提供参考价值。

ATCA;通用设备;冗余;用户接口

近年来,在通讯行业中ATCA架构正在逐渐取代传统架构成为电信系统中的主流,它与电信级Linux相互支持,共同促进着电信行业乃至整个信息产业的发展。在这个平台上若能再配合兼容最新的硬件标准和接口规范并满足开放性要求的中间件,就可以形成一套完整的机制,提供高效可靠的服务,从而使运营商专注于应用层的开发。

1 系统的主要模块

ATCA标准的机架内各部件实际上也都是独立的计算机。各部件自身都运行嵌入式操作系统,能够独立提供服务。因此,所谓对机架内通用设备的管理实质就是对这些独立的计算机部件进行管理,完整的硬件系统构如图1所示。

图1 系统硬件构成图

图1 中所有设备都采用硬件冗余。其中,主服务器是这个架构的核心单元,中间件软件(包括设备管理子系统)也运行其上。图中主服务器是机架外的独立服务器,当然也可以是机架内的某个SBC。OSW(outside switch)即外部交换机(内外是相对于机架而言),负责机架内外的数据传输。其余部件都位于ATCA机架内。CMM作为机架控制单元,对机架上的硬件控制通过操作CMM实现。

2 核心技术设计

2.1 集群管理的设计

2.1.1 冗余机制

本论文主要涉及和应用的冗余硬件有:电源,散热系统,网络数据传输单元和服务器自身。

1)电源。高端服务器普遍采用双电源系统,而且这两个电源多是负载均衡的,即在系统工作时它们都为系统提供电力,当一个电源出现故障时,另一个电源就承担所有的负载。

2)散热系统。散热装置有多种,方便理解起见我们简单考虑风扇。散热系统的冗余是指在服务器的关键发热部件上配置的降温风扇有主用和备用两套,这两套风扇具有自动切换功能。而当主风扇出现故障或转速低于规定要求时,备用风扇马上启用。

3)存储系统。存储系统是整个服务器系统中最容易发生故障的地方。大型系统中都采用了冗余机制来确保存储系统的可靠。

4)I/O卡。对服务器来说,主要指网卡和硬盘控制卡的冗余。冗余网卡技术原为大型机及中型机上的技术,现在也逐渐被PC服务器所应用。PC服务器如Micron公司的NetFRAME9200最多实现4个网卡的冗余,这4个网卡各承担25%的网络流量。康柏公司的ProSignia/Proliant服务器都具有容错冗余双网卡。

5)PCI总线。对等PCI技术优化PCI总线的带宽,提升硬盘、网卡等高速设备的数据传输速度。

6)CPU。系统中主处理器并不会经常出现故障,但对称多处理器(SMP)能让多个CPU分担工作以提供某种程度的容错。

从实际环境出发,本课题设计的ATCA通用设备管理系统将选用1+1的冗余方式实现高可用性。即用两个完全相同的控制器,其中一台作为主控制单元承担全部的监视控制任务。在主控制器故障情况下,不须人工干预即可自动切换至备用控制器工作,使整个系统不会发生停滞。

2.1.2 有限状态机

有限状态机是一种用来进行对象行为建模的工具,其作用主要是描述对象在它的生命周期内所经历的状态序列,以及如何响应来自外界的各种事件。游戏引擎是有限状态机最为成功的应用领域之一,由于设计良好的状态机能够被用来取代部分的人工智能算法,因此游戏中的每个角色或者器件都有可能内嵌一个状态机[1-2]。考虑RPG游戏中城门这样一个简单的对象,它具有Opened,Closed,Locked,Unlocked 4种状态,如图2所示。

图2 控制城门的状态机

当玩家到达一个处于Locked状态的门时,如果此时他经找到了用来开门的钥匙,那么他就可以利用它将门的当前状态转变为Unlocked,进一步还可以通过旋转门上的把手将其状态转变为Opened,从而成功地进入城内。

2.1.3 IP接管

IP接管就是为了保证热切换过程中服务不中断以及单一的逻辑集群视图[3]。在我们设计的这个系统中,IP接管的工作过程是这样的。我们假设客户端C想要和由S1和S2组成的冗余系统通信。现在S1处于ACT状态,拥有外网IP。而S1、S2和C各有一张ARP缓存表,该表中存储了IP和硬件MAC地址的对应(一对一)关系。

2.1.4 数据同步

为了确保业务数据的同步,本系统使用共享磁盘技术实现存储管理。即冗余的两个服务器将不再存储业务数据,而将数据存放在独立的外部的RAID上。如图3。

图3 共有磁盘示意图

2.1.5 心跳监测

本系统设置心跳周期初始值是3秒,而心跳延迟的允许时间被设置为10秒。由于本系统采用的是1+1冗余方式,一个集群包括两个节点,我们采用UDP的环形心跳。

心跳进程组由一组相关进程和用于进程通讯的管道组成。其进程包括有:控制进程、状态进程、套接字的读和写进程[4]。其管道有:主状态管道、控制FIFO等。进程都具备实时优先级,被锁定在内存中,不会换出,保证了心跳检测快速高效。可以参考图4所示。

图4 心跳数据流

2.2 两种用户接口模式的设计

高可用性电信中间件得到了ATCA的有效支持,ATCA能支持多种标准机箱管理接口,包括CLI,HTTP,RPC,HPI和RMCP(局域网上的IPMI),在本系统中,我们将设计两种基本的接口模式:CLI和RPC接口[5]。

2.2.1 CLI 模式的设计

CLI(命令行接口,command line interface)可以和机架上的智能管理设备如CMM、ISW、SBC等交互。CLI模式是基于IPMI库的命令组成,能够被高级管理应用直接接触。出于硬件检测和实时监控的目的,ATCA机架上的各个部件上都安装了不同类型的传感器。想要获知某设备的某个参数值,通过查询该传感器的当前值即可[6]。本系统的按照逻辑关系分为3层索引。对这3层的指定是描述上的从大到小(从各个刀片机到传感器的某一参数值)逐步精确具体化的过程。

设备的三层架构如表1所示。

表1 ATCA机架设备的三级架构

第一层是field层。每一个field就是一个独立的计算机。第二层是sensor层。每一个sensor都是一个要监控的设备项。第三层是item层。就是具体每一个sensor的相关值。

2.2.2 RPC模式的设计

RPC(Remote Procedure Call Protocol)——远程过程调用协议,RPC采用客户机/服务器模式。请求程序就是一个客户机,而服务提供程序就是一个服务器。运行时,一次客户机对服务器的RPC调用,其内部操作大致有如下十步,大致流程如图5所示。

图5 RPC流程图

1)调用客户端句柄;执行传送参数;

2)调用本地系统内核发送网络消息;

3)消息传送到远程主机;

4)服务器句柄得到消息并取得参数;

5)执行远程过程;

6)执行的过程将结果返回服务器句柄;

7)服务器句柄返回结果,调用远程系统内核;

8)消息传回本地主机;

9)客户句柄由内核接收消息;

10)客户接收句柄返回的数据。

3 结束语

通讯级高可用中间件的系统非常繁杂,本文只对其中的一个核心子系统——通讯设备管理系统进行了研究。如何将这个模块和其他诸多模块统筹思考,做到高内聚低耦合,减少因为模块间的开销而影响整个中间件系统的性能,将是进一步的工作。

[1]Chuang J,Sollenberger N.Beyond 3G:wideband wireless data access based on OFDM and dynamic packet assignment.Communications Magazine.2000,38(7):78-87

[2]孙静,高林,李海波.中间件技术与标准研究[J].信息技术与标准化,2006(10):9-11.

[3]Batista A.J.N,Neto A.,Correia M.ATCA Control System Hardware for the Plasma Vertical Stabilization in the JET Tokamak.Nuclear Science,2010,57(2):583-588.

[4]SJ Jang.Design of the Kernel Hardening Function in the Linux Network Module[J].International Journal of Computer Science and Network security,2006,6(8):135~140.

[5]黄刘生,李黄海,吴俊敏.一种可动态更新的高可用中间件框架[J].华中科技大学学报:自然科学版,2006,34(10):8-10.

[6]陈子平.浅谈控制系统冗余控制的实现 [J].自动化仪表,2005,26(9):12-16.

Application design of communication equipment management system based on ATCA

TONG Jian-fei
(Xi’an International University,Xi’an 710077,China)

The communications industry to protect the system data processing of high performance,the telecom operation system and meet the ATCA (Advanced Telecommunications Computing Architecture,advanced Telecom Computing Architecture)specification of the hardware platform.In this paper,how to design a oriented ATCA platform of telecommunication middleware equipment management system for the purpose of the study,through the system redundancy and interface design,for the communications industry,the data processing of high reliability provide a reference value.

ATCA;General equipment;redundancy;user interface

TN91

A

1674-6236(2016)15-0184-03

2015-07-18 稿件编号:201507135

同剑飞(1974—),男,陕西西安人,硕士,助教。研究方向:计算机控制。

猜你喜欢

状态机中间件网卡
部署Linux虚拟机出现的网络故障
基于有限状态机的交会对接飞行任务规划方法
Server 2016网卡组合模式
RFID中间件技术及其应用研究
基于Android 平台的OSGi 架构中间件的研究与应用
三段式状态机在单片机中的实现
挑战Killer网卡Realtek网游专用Dragon网卡
中间件在高速公路领域的应用
一种支持智能环境构建的中间件
基于反熔丝FPGA的有限状态机加固设计