全流量监控
——科来全流量分析实现数据中心智能运维
2018-11-09季莹,赵志远,章继刚
当前运维已由监控告警的初级形式向着自动化、智能化方向演进。进入运维4.0时代后,通过引入网络流量分析数据来实现针对大量应用、业务日志的集中式高效分析。
成都科来软件有限公司技术经理齐宇飞(如图1)解释了运维新时代的实现途径,即以大数据和机器学习为手段,整合现有多种监控数据和业务数据、事件,结合原有的人工运维操作等,实现复杂能力的工具化,进而实现运维操作的自动化,或称之为“AIOps”,如图2。
科来以网络全流量分析作为切入点,努力实现以上目标,但要实现全流量的分析并不简单, 对于数据中心而言,传统数据中心与云数据中心的运维也有所不同,齐宇飞认为,第一,如何获取流量,比如有些数据中心是通过SDN的流量,它并不是那种传统上可以做镜像的,而科来是可以通过一定手段去实现的;第二是整体处理性能,当万兆口流量出现了,整机处理能力能不能跟上;第三,是否支持数据中心级的部署模式,因为一个数据中心有无数多的点要去采集,所以构架一定是分布式的,多点采集,到统一的分析中心汇总;第四,在海量数据中如何找出问题点。
图1 科来 齐宇飞
图2 AIOps框架图
现代化的数据中心是全流量分析的重要应用场景,在数据中心侧,要能够实现应用的全局监控,快速准确的展现应用和业务运行状态,同时对于应用路径的各个环节也必须实现全路径监控。不仅如此,还要考虑云计算虚拟化环境、SDN、移动互联网等场景,并能在应用交易路径的所有环节都要部署流量采集点,并加以统一视图的分析。
在IT团队建设上,新一代的智能运维平台不能仅面向某一个团队,网络、应用、研发、安全等各部门的配合也是业务稳定运行的关键,智能运维平台应具备多层次的监控运维能力,既针对特定部门的特定需求提供精准的监控和操作工具,也可以针对部门间配合协调需求,提供集成化监控分析和操作手段。
在未来,智能运维是运维发展的重要方向,而基于全流量分析技术则是实现智能运维的重要手段之一,在此次“2018中国数据中心建设论坛”上,科来荣获“2018企业级数据中心建设十大用户信赖品牌”奖。