APP下载

云集群服务器系统监控管理方法与设计实现

2021-11-23班华堂

通信电源技术 2021年11期
关键词:云集技术人员集群

班华堂

(浪潮商用机器有限公司,山东 济南 250000)

0 引 言

云集群服务器系统以云计算作为平台,将各类服务器进行联动,使得服务器群可以在较短的时间内快速处理各类信息,在很大程度上提高服务器的运算处理能力。随着技术经验的逐步积累,云集群服务器系统适用范围日益广泛,逐步形成了支持各类异构设备与异构数据的网络框架,可以根据用户的使用需求实现信息数据的分类处理,在信息产业内部形成了更为精细化的分工。基于云集群服务器的技术优势,在实际管理环节应当建立完善的监控管理体系,形成实时化、立体化的监控管理机制[1]。

1 云集群服务器系统监控管理特点分析

通过对云计算、集群服务等技术概念的梳理,引导技术人员在思维层面形成准确的观念认知,把握云集群服务器监控管理的基本要求,明确监控管理重点环节,为后续设计要点的梳理语义技术应用等提供方向性引导。

1.1 云计算与集群服务器

云计算利用信息网络形成灵活共享的计算资源平台,该平台通过用户访问机制,使得用户可以根据自身需求在较短的时间内快速获取各类资源,在满足信息获取需求的同时降低常规性信息获取难度。同时云计算技术以分布式基础架构作为底层逻辑,其在很大程度上可以满足服务器群拓展的需要,例如LaaS、PaaS以及SaaS等云计算架构极大地提升了云计算的适用性[2]。根据实际使用需求,技术人员通过选择合理的云计算技术框架、动态添加各类物理设备以及融合相关应用程序,可以有效控制集群服务器的使用成本。集群服务器将多个独立的服务器串联起来组建成单一化的系统,这种系统构成使服务器信息处理能力得到提升,避免集群服务器运行出现过载的情况,造成系统崩溃。随着相关技术经验的持续积累,集群服务器系统的组成日趋完善,超级群服务器、PC服务器以及中档服务器的使用兼顾了集群服务器运算处理能力与服务器使用成本管控。近些年来,信息产业发展过程中,基于技术创新与产品研发等不同的需求,技术人员将云计算技术与集群服务器结合起来构建了云集群服务器系统方案。由于系统结构复杂,为确保云集群服务器系统的正常运行,需要在系统内部构建起相应的监控与管理机制。通过监控与管理机制的介入,确保云集群服务器系统稳定运转,减少设备故障的发生,实现持续性的信息处理、存储服务。

1.2 云集群服务器系统监控管理

由于云集群服务器系统监控管理涉及多个对象,监控管理任务体量较大,因此技术人员在云集群服务器系统监控管理设计环节应当采取简化设计的原则,着力提高监控管理的容错率,通过基础设施层、中间件层、显示层以及运维管理层等不同系统模块的配合联动实现云集群服务器系统的动态化监控,根据监控结果灵活调整系统状态,确保云集群服务器系统平稳运转[3]。

2 云集群服务器系统监控管理系统设计要点

由于云集群服务器系统监控管理系统定位较为特殊且服务对象多元,为确保系统设计的有效性与合理性,技术人员有必要结合云集群服务器系统监控管理的特点,吸收借鉴过往有益经验,梳理并明确设计要求。

2.1 组建监控管理架构

云集群服务器系统涵盖大量的服务器,在运行过程中形成了数量众多的网络节点。网络节点作为监控管理的关键区域,通过监控管理架构的合理搭建,可以实现对网络节点的有效覆盖,保证云集群服务器监控管理活动的有序开展。基于这种认知,技术人员在监控管理架构组件环节可以从被监控服务器集群、监控管理服务器以及管理客户端等模块入手,设计完备的监控管理机制[4]。具体来看,被监控服务集群应当采取分布式部署的形式,根据技术能力划定不同数量的子集群。子集群作为监控管理的对象,最大程度地消除监控管理盲区,提升云集群服务器系统监控管理的精准性。由于监控管理服务器主要功能在于对云集群服务器子集群开展持续的监控,因此每一台监控管理往往对应多个云集群服务器系统子集群。以监控管理服务器为基础,将子集群服务器运行过程中产生的各类监测指标进行汇总,针对汇总后的监控指标开展信息评估,以确保云集群服务器系统的运行状态可以准确呈现。技术人员根据获取到的相关数据,开展相应的管理举措,做好云集群服务器系统的调度,确保系统负载均衡,规避系统风险。管理客户端作为监控管理入口,用户登陆客户端后可以快速获取云集群服务器的整体运行状态,在此基础上发出相应的管理指令,对服务器子集群的负载做好科学调整,以防范服务器故障的发生。管理客户端设置环节,可以采用B/S框架,并设立Web监控模块,便于用户采取灵活的操作方案对云集群服务器系统开展精准管理。

2.2 健全监控管理方案

在云集群服务器系统监控管理环节,技术人员需要有针对性地构建监控管理方案,对核心数据做好评估与分析。针对云集群服务器系统硬件系统、软件程序运行的特点,选取监控管理指标,提高监控管理方案的可操作性。例如考虑到云集群服务器系统中服务器主机类型多样,在监控管理方案设计过程中需要选择多元化直观的性能指标,实现云集群服务器性能的综合判定。除了做好上述技术指标的选择之外,还需要设置监控管理层次,构建完备化的监控管理体系[5]。实际性能检测采集环节,技术人员依据检测指标开展服务器监测、应用监测等工作,实现监测指标的有效覆盖,减少监测漏洞的出现。服务器监测设计环节,技术人员以服务器主机作为监测管理对象,针对主机硬件、软件的差异,采取相对应的监测措施。服务器类型与监测主要指标如表1所示。

表1 服务器类型与监测主要指标

技术人员通过设置不同的性能监测指标开展必要的监测分析,实现云集群服务器系统模式下服务器运行状态的科学掌握,为后续服务器管理、维护等工作的开展奠定坚实基础。云集群服务器系统中的软件应用包括数据库、Web服务以及应用服务,相应程序运行时会产生大量的数据,技术人员可以按照实时数据、每天数据或每月数据开展软件程序性能监测以及管理等工作。在不同监测数据采集环节,利用数学模型针对性地完成指标数据的获取、分析等操作。以每天数据为例,技术人员采用数据采集模型进行分析处理,即“hourvVauek=(,)/12,(0≤k≤23)”,其中hourvVauek表示一天内第k个小时服务器监测指标的平均值。监测周期为24 h,将每个监测周期内产生的各类监测性能指标以及相关户数存储到数据库中,通过横向对比逐步明确云集群服务器系统24 h内的运行状态,为后续系统管理活动的开展提供引导。

3 云集群服务器系统监控管理系统实现策略

云集群服务器监控系统的实现要求技术人员从实际角度出发,以科学性、实用性原则为基础,在划定系统设计框架的前提下整合现有技术资源,积极稳妥地推动云集群服务器系统监控管理工作的实现,确保系统平稳、高效运行。

云集群服务器监控管理系统运行管理环节,技术人员应当设立告警指标和监控管理阈值,同时设定监测数据预警的上限及下限,在此基础上形成科学化的监控管理模式,确保云集群服务器的科学管理[6]。例如,当监测数据指标连续超过次要警告阈值并达到规定次数,则显示为次级预警;当监测数据指标连续超过告警阈值并达到规定次数,则显示为预警。技术人员根据预警信息,可以判定云集群服务器运行状态,并有针对性地做好系统管理决策,确保云集群服务器系统平稳运行。

4 结 论

云集群服务器系统监控管理对于提升服务器信息处理能力有着极大的帮助,是信息产业升级的重要路径,实现了对信息产业硬件服务能力与服务成本的全面兼顾。本文从多个角度出发,在明确云集群服务器系统基本特点的前提下,采取相应技术举措,加速实现云集群服务器系统监控管理模式的构建。

猜你喜欢

云集技术人员集群
越南农业管理和技术人员线上培训
我国首批正高级船舶专业技术人员评出
智慧相册
云山图
中外学者云集山西 共商乡村复兴大计
海上小型无人机集群的反制装备需求与应对之策研究
培育世界级汽车产业集群
一种无人机集群发射回收装置的控制系统设计
勤快又呆萌的集群机器人
精英云集