APP下载

当IT管理遇到人工智能

2018-08-29孙杰贤

中国信息化 2018年8期
关键词:安吉运维性能

孙杰贤

“7X24”,“3个9或5个9”,这是IT运维管理的一些基本要求,尤其是在电信、航空、金融等运营性和服务性领域。相对应,有着IT消防员之称的IT运维管理人员的工作状态是这样的:疲于奔命、加班熬夜、压力山大、出力不讨好。“累死累活一个月下来,虽然忙得手脚不着地,可挨领导的批评也更多了,因为虽然问题是解决了,却收到了更多的投诉:找不到人、反应速度太慢、相似的问题总出现、没有预防措施......”

运维之困

当企业乃至整个社会对IT的依赖不断提高,企业IT系统在变得日趋重要的同时也变得庞大而复杂。由此导致系统警报和故障的发现、排除和管理变得更加困难。在纵横交错的IT系统中、在浩瀚无边的数据流里发现故障所在无异于大海捞针,更不要说发现潜在的问题。如果完全依靠人海战术,既不现实也不是长久之计。以前,十几名IT运维管理人员可以维护管理几百个节点;现在,节点的数量猛增到几万个,显然,IT运维管理人员数量不可能相应进行上百倍的增加,即使增加,也不一定能够解决问题。

怎么办?答案便在人工智能和机器学习,将这两项技术引入IT运维管理从而真正实现自动化和智能化运维,解放IT管理员们。据Gartner预测,到2020年,近50%的企业将在他们的业务和IT运维方面采用人工智能和机器学习技术,远高于2017年的5%。

随着“互联网+”的普及和“软件定义”的兴起,应用性能管理APM已经成为IT运维管理最重要也是最主要的环节之一。APM通过监测和诊断复杂应用程序的性能问题,来保证软件应用程序的运行性能和可用性从而确保用户体验。

安吉星,一家企业,一款产品,一套应用——涉及碰撞自动求助、紧急救援、安全保障、车况检测以及车辆被盗协寻等多种服务。“安吉星的愿景是通过创新科技建构‘人-车-生活的智能互联,导航和安全控制只是安吉星的应用服务之一。在C端,安吉星还可以提供车主生活助理服务,比如酒店、餐厅、代驾等预约服务以及智能家居服务;在B端,安吉星提供車队管理以及金融等服务。” 安吉星应用监控项目负责人茅烨隽在接受本刊采访时表示,“安吉星即应用、即服务,因此确保应用的性能和可用性从而提高服务水平和消费体验是安吉星的根本诉求。这也是为什么安吉星中国在成立之初便引入Dynatrace的APM系统,让被动的维护变成主动的管理。”

突破与改变

茅烨隽提到的Dynatrace公司连续八年入围Gartner应用性能监测套件(APM)魔力象限领导者象限,是该领域绝对的领军者。在第五届Dynatrace Perform 2018大中华区用户大会上,该公司推出了一款面向企业云环境的人工智能全栈式监控运维平台,目的只有一个,那就是实现企业IT的智能化运维管理,从而让DevOps理念真正落地。对于该平台的发布,Dynatrace全球销售高级副总裁Stephen Pace 如此表示:“六年前,我们便预测到,云计算、物联网、微服务等引发的变革将对应用和基础设施市场产生巨大的影响,于是我们决定重塑监控,打造一个以人工智能技术为核心的性能管理平台。现在,这一平台将真正帮助用户利用领先的AI技术实现更高效、智能的性能管理,在迅猛发展的云市场中抢占业务先机。同时,该平台的发布也正式宣告Dynatrace全面转型为一家软件智能公司。”

我们来简单看一下该平台的技术突破和价值。技术突破有四点,主要集中在全栈式、自动化和智能化这几大特征上:人工智能和机器学习技术的深度应用,直接提供给企业可解决性能问题的答案,而不只是性能数据报表;以单一代理方式,涵盖全栈式应用,并提供实时依赖关系模型;面向整个生态系统的应用编程接口,可推动和激发企业自动化IT管理 ;通过真实用户体验与回放技术,让用户可以洞察并掌控全程。应用价值如下:更快实现性能管理、更少的管理工具、更少的资源占用、更少的修复时间以及弹性的智能监控。

可见,人工智能带给IT运维管理的改变是巨大的,它可以填补我们人类跟浩瀚的系统数据之间的空白,提供给IT运维管理人员必要的操作智能和速度,大大减轻了人工故障排除和实时决策的负担。可以想象一下:多少年以后,IT运维管理领域出现了更高级的人工智能服务,这个新的人工智能服务完全可以自动检查IT设备和系统的故障并自主进行故障排除和系统恢复,于是,几乎大大小小的企业和组织全部都在使用这样的机器服务,以至于世界上所有的IT运维工程师们都面临转型的挑战。

猜你喜欢

安吉运维性能
小丑拉绳
基于GPS的电力运维轨迹定位系统
生与死的尊严(散文)
IT运维管理系统的设计及应用
桌面端,GTX 1650并不是千元价位的显卡好选择
看到了什么
世界最美婚礼
世界最美婚礼
电子政务甲方运维管理的全生命周期