APP下载

无线城市业务探针系统方案的研究与实现

2014-09-27任昱光夏冰

移动通信 2014年16期
关键词:探针

任昱光 夏冰

【摘要】随着无线城市业务的快速发展,业务质量监控变得愈发重要。基于运营商的网络层次,设计了一套无线城市业务自动拨测及告警系统,用于监控无线城市业务质量,并对该系统的探测流程及应用实例进行了详细分析。

【关键词】无线城市 探针 拨测 业务预警

中图分类号:TN92 文献标识码:A 文章编号:1006-1010(2014)-16-

[Abstract]With the rapid development of wireless city service, the supervision of the service of quality (QoS) becomes more important than ever before. A set of wireless city service automatic dial test and alarm system based on operator network level is designed to monitor the QoS of wireless city service. In addition, the detection process and the application instance of the system are analyzed in detail.

[Key words]wireless city probe dial test business early-warning

1 引言

无线城市业务是中国移动通过无线网络为政府、企业、家庭和个人用户提供无线信息化服务,涵盖了无线政务、生活服务、医疗保健、交通查询、旅游指南、教育培训、求职就业及购物优惠等各类服务信息。

目前,无线城市业务主要通过人工拨测的方式监控业务质量。随着无线城市业务逐步开展,各种应用越来越丰富,与业务相关的接口数量、应用数量、设备数量逐渐增多,通过人工拨测的方式监控业务质量消耗人力成本大且时效性差。为了保障无线城市业务稳定、健康运行,及时发现并解决业务、接口服务和设备的质量问题,本文提出了一种适用于异构多系统的业务自动拨测及告警实现方案,即业务探针系统方案。

2 无线城市业务探针系统

如图1所示,业务探针系统主要包括:前端配置、展示部分(红色虚线包含部分)、后台服务部分(蓝色虚线包含部分)、告警能力部分(黄色虚线包含部分)。业务探针系统能够从功能、性能角度,多维度对无线城市接入的应用、相关接口、部署机器进行实时监控和探测,实时了解无线城市业务运行的健康状况,统一进行管理和分析,以提升无线城市业务运行的稳定性,提高用户体验满意度[1]。

业务探针系统各部分的功能详细阐述如下:

(1)前端配置、展示部分:主要包括系统配置管理、账号管理、业务管理、视图管理、统计分析管理、日志管理,用于对整个系统的全局参数进行配置、对系统访问进行控制和鉴权、对权重节点/业务节点/业务探针进行管理、对系统操作日志与业务告警日志进行管理等日常管理功能。

(2)后台服务部分:包括功能探测服务、性能探测服务、告警服务等系统核心功能服务。

◆功能探测服务:以多线程的方式对业务的功能状况进行周期性探测;

◆性能探测服务:以多线程的方式对业务的性能状况进行周期性探测;

◆告警服务:用于实时扫描当前出现的业务告警,并以短信、邮件方式进行通知。

(3)告警能力部分:提供多样式的告警通知,如支持短信告警、邮件告警、电话告警等告警功能。

3 业务探针系统探测流程

业务探针后台服务子系统根据系统配置的业务节点,对业务节点的健康度(性能、功能)进行探测分析,将探测结果数据写入数据库中,提供给展现层处理展示。业务子系统的扫描探测为周期任务,可由系统自动执行探测,也可由管理员手工执行探测[2]。

单个周期探测流程如图2所示:

步骤1:业务探测开始时,加载全局配置信息以及业务节点配置信息,分别以多线程的方式进行功能探测、性能探测。该步骤的规则如下:

(1)每次探测开始,首先加载全局配置信息(如功能线程数、性能线程数、短信通知开关等)和业务节点相关信息(如功能告警阀值、性能告警阀值、绑定的探针以及探针的基本参数等),保存于全局对象中;全局对象里面保存了系统的一些全局配置信息(如功能线程数、性能线程数等)以及本次探测的所有业务节点的相关信息(包括每个业务节点绑定的探针的基本信息),以便在整个探测周期内共享公用信息。

(2)全局对象信息在各个性能、功能线程中共享。

(3)每个功能、性能探测线程中,业务节点探测的优先顺序由每个业务节点的等级决定,等级越高越优先探测。在新增业务节点时,每个业务节点必须制定1个业务节点等级。系统默认包括3个等级:一般、重要、非常重要,这3个等级的优先顺序为:一般<重要<非常重要。

(4)每个业务节点绑定支持多语言开发的探针,如Python、Java。

(5)探测过程中,以动态加载探针插件方式对业务节点进行探测。本技术动态加载关键点如下:

◆所有的探针实现统一继承1个基础类Probe,并覆盖实现该类的funcProbe和perfProbe方法,这两个方法分别对应具体的功能探测与性能探测;

◆加载探针插件类前,将探针所在的包路径(该信息已保存于对应的业务节点信息中,在(1)中被加载)添加到Path路径中;

◆通过Python的_import_加载探针插件类;

◆通过反射实例化探针类,分别执行funcProbe和perfProbe方法,以完成功能与性能的探测;endprint

◆将探针所在的包路径从Path移除。

(6)功能、性能探测采用采样的方式进行探测,采样数保存于业务节点配置信息中,可以根据某个业务节点的实际情况进行配置,每次采样的所有相关信息(如请求数据信息、响应数据、探测成功状态、响应时间、业务出现问题时的可能原因等[3])统一写入到MySQL数据库,保证整个探测流程的数据都被保存,以便在业务出现问题时,根据这些信息快速定位问题。

采样示例:以郑州公积金查询应用的性能探测为例,假如性能采样数为10,则表示依次请求10次郑州公积金查询应用,分别记录每次请求的响应时间,然后取10次的平均响应时间(算法详见步骤2)作为本次性能探测的结果得分。

(7)单个业务节点(探测对象)探测流程如图3所示:

步骤2:当功能探测、性能探测完成后,启动告警扫描服务,对当次的功能、性能探测结果数据进行分析扫描[4]。该步骤的规则如下:

(1)告警的判断方式:功能告警是通过功能告警阀值判断,性能告警是通过性能告警阀值判断。

功能告警阀值:用最低采样结果成功数表示。如:某个业务节点的功能总采样数为10,功能告警阀值设置为8,这里的8表示8次采样结果成功。如果该业务节点的10次采样中只有7次的采样满足成功条件,则该业务节点就出现功能告警,否则未出现功能告警。

采样结果成功的判断标准:1表示本次采样成功,业务正常;0表示本次采样不成功,业务不正常。具体在什么情况返回1或0,由具体的探针根据不同业务场景的需要进行定制化实现判断。

性能告警阀值:用最长的平均响应时间表示。如:某个业务节点的性能总采样数为10,性能告警阀值设置为15(单位:秒),当10次采样的平均响应时间大于15(养老查询等7个页面:该业务节点的性能告警阀值)×1000,则该业务节点出现性能告警,否则未出现性能告警。

(2)平均响应时间算法为:

ART=(T1+T2+T3+…+Tn)*1000/n (1)

其中,ART表示平均响应时间,单位为毫秒;T1…Tn表示n次采样中每次采样的响应时间,单位为秒。

步骤3:告警扫描完成后,若发现业务告警则根据系统的全局配置信息,调用短信能力或邮件能力发送告警通知信息,及时告知当前业务运行中出现的问题。短信或邮件信息中包含了出现告警的业务节点的详细信息(如业务访问URL、业务出现告警的原因、探测请求数据、探测响应数据等),这些信息可以帮助维护人员快速定位问题,以便在业务出现问题时快速解决问题[5]。

单个业务节点(探测对象)告警判断过程如图4所示:

4 业务探针系统应用实例

实际应用以郑州公积金查询的普通页面功能探测为例进行说明,具体如表1所示:

5 业务探针系统实践效果

根据以上结构框架及探测流程的业务探针系统,已在河南移动部署并安全运行了一年,较以往拨测系统具有如下优点:

(1)定制化(探针多样化):业务探针技术使用的探针可以根据不同的业务场景、不同的应用及接口,进行探针定制化,以满足个性化的探测需求,现共有拨测189项应用。

(2)业务探测周期时间短:由于业务探针技术采用程序控制探测业务的复杂度,以多线程、自动化方式去完成探测,有效地减少了单次业务探测的时间,单次业务探测耗时下降95%。

(3)具备统计分析功能:采用业务探针技术,可以从多角度、多维度对业务的健康状况进行分析和统计,业务统计指标由原来的3项丰富为10项。

(4)实时性、可控性好:业务探针技术采用多线程探测方式,在控制业务探测周期的同时还保证了业务探测的实时性,且具备探测周期可控制的优点。

6 结束语

本文提出的业务探针系统能够将复杂、低效的拨测规范为自动化操作,通过在河南移动的实际使用,证明了该系统的可实施性和可部署性,能够满足无线城市各接入平台的管理和监测。此外,该系统同样也适用于其他异构多系统的管理和监控。

参考文献:

[1] 高峰,高泽华,文柳,等. 无线城市:电信级Wi-Fi网络建设与运营[M]. 北京: 人民邮电出版社, 2012.

[2] Erich Gamma, Richard Helm, Ralph Johnson, et al. 设计模式:可复用面向对象软件的基础[M]. 李英军,马晓星,蔡敏,等译. 北京: 机械工业出版社, 2005.

[3] 王兴亮,张亮. 基于“无线城市”的无线宽带接入技术应用[J]. 现代电子技术, 2008(21): 16-18.

[4] 张威,汤炳富. GSM交换网络维护与优化[M]. 北京: 人民邮电出版社, 2005.

[5] 赖卫国,许俊禹,胡严,等. 移动无线数据新业务[M]. 北京: 人民邮电出版社, 2007.

作者简介

任昱光:工程师,硕士毕业于北京邮电大学,现任中国移动通信集团河南有限公司计划建设部主管,目前从事移动业务网络规划与管理工作,主要研究方向为移动多媒体,曾组织完成河南无线城市、短信中心、彩铃平台等多项系统建设。

夏冰:讲师,硕士毕业于北京林业大学,现任职于河南职业技术学院,目前从事城市规划与设计工作,主要研究方向为城市规划,曾独立完成北京地区花境数据库建立,参与北京市朝阳区数字化社区建设等项目。endprint

◆将探针所在的包路径从Path移除。

(6)功能、性能探测采用采样的方式进行探测,采样数保存于业务节点配置信息中,可以根据某个业务节点的实际情况进行配置,每次采样的所有相关信息(如请求数据信息、响应数据、探测成功状态、响应时间、业务出现问题时的可能原因等[3])统一写入到MySQL数据库,保证整个探测流程的数据都被保存,以便在业务出现问题时,根据这些信息快速定位问题。

采样示例:以郑州公积金查询应用的性能探测为例,假如性能采样数为10,则表示依次请求10次郑州公积金查询应用,分别记录每次请求的响应时间,然后取10次的平均响应时间(算法详见步骤2)作为本次性能探测的结果得分。

(7)单个业务节点(探测对象)探测流程如图3所示:

步骤2:当功能探测、性能探测完成后,启动告警扫描服务,对当次的功能、性能探测结果数据进行分析扫描[4]。该步骤的规则如下:

(1)告警的判断方式:功能告警是通过功能告警阀值判断,性能告警是通过性能告警阀值判断。

功能告警阀值:用最低采样结果成功数表示。如:某个业务节点的功能总采样数为10,功能告警阀值设置为8,这里的8表示8次采样结果成功。如果该业务节点的10次采样中只有7次的采样满足成功条件,则该业务节点就出现功能告警,否则未出现功能告警。

采样结果成功的判断标准:1表示本次采样成功,业务正常;0表示本次采样不成功,业务不正常。具体在什么情况返回1或0,由具体的探针根据不同业务场景的需要进行定制化实现判断。

性能告警阀值:用最长的平均响应时间表示。如:某个业务节点的性能总采样数为10,性能告警阀值设置为15(单位:秒),当10次采样的平均响应时间大于15(养老查询等7个页面:该业务节点的性能告警阀值)×1000,则该业务节点出现性能告警,否则未出现性能告警。

(2)平均响应时间算法为:

ART=(T1+T2+T3+…+Tn)*1000/n (1)

其中,ART表示平均响应时间,单位为毫秒;T1…Tn表示n次采样中每次采样的响应时间,单位为秒。

步骤3:告警扫描完成后,若发现业务告警则根据系统的全局配置信息,调用短信能力或邮件能力发送告警通知信息,及时告知当前业务运行中出现的问题。短信或邮件信息中包含了出现告警的业务节点的详细信息(如业务访问URL、业务出现告警的原因、探测请求数据、探测响应数据等),这些信息可以帮助维护人员快速定位问题,以便在业务出现问题时快速解决问题[5]。

单个业务节点(探测对象)告警判断过程如图4所示:

4 业务探针系统应用实例

实际应用以郑州公积金查询的普通页面功能探测为例进行说明,具体如表1所示:

5 业务探针系统实践效果

根据以上结构框架及探测流程的业务探针系统,已在河南移动部署并安全运行了一年,较以往拨测系统具有如下优点:

(1)定制化(探针多样化):业务探针技术使用的探针可以根据不同的业务场景、不同的应用及接口,进行探针定制化,以满足个性化的探测需求,现共有拨测189项应用。

(2)业务探测周期时间短:由于业务探针技术采用程序控制探测业务的复杂度,以多线程、自动化方式去完成探测,有效地减少了单次业务探测的时间,单次业务探测耗时下降95%。

(3)具备统计分析功能:采用业务探针技术,可以从多角度、多维度对业务的健康状况进行分析和统计,业务统计指标由原来的3项丰富为10项。

(4)实时性、可控性好:业务探针技术采用多线程探测方式,在控制业务探测周期的同时还保证了业务探测的实时性,且具备探测周期可控制的优点。

6 结束语

本文提出的业务探针系统能够将复杂、低效的拨测规范为自动化操作,通过在河南移动的实际使用,证明了该系统的可实施性和可部署性,能够满足无线城市各接入平台的管理和监测。此外,该系统同样也适用于其他异构多系统的管理和监控。

参考文献:

[1] 高峰,高泽华,文柳,等. 无线城市:电信级Wi-Fi网络建设与运营[M]. 北京: 人民邮电出版社, 2012.

[2] Erich Gamma, Richard Helm, Ralph Johnson, et al. 设计模式:可复用面向对象软件的基础[M]. 李英军,马晓星,蔡敏,等译. 北京: 机械工业出版社, 2005.

[3] 王兴亮,张亮. 基于“无线城市”的无线宽带接入技术应用[J]. 现代电子技术, 2008(21): 16-18.

[4] 张威,汤炳富. GSM交换网络维护与优化[M]. 北京: 人民邮电出版社, 2005.

[5] 赖卫国,许俊禹,胡严,等. 移动无线数据新业务[M]. 北京: 人民邮电出版社, 2007.

作者简介

任昱光:工程师,硕士毕业于北京邮电大学,现任中国移动通信集团河南有限公司计划建设部主管,目前从事移动业务网络规划与管理工作,主要研究方向为移动多媒体,曾组织完成河南无线城市、短信中心、彩铃平台等多项系统建设。

夏冰:讲师,硕士毕业于北京林业大学,现任职于河南职业技术学院,目前从事城市规划与设计工作,主要研究方向为城市规划,曾独立完成北京地区花境数据库建立,参与北京市朝阳区数字化社区建设等项目。endprint

◆将探针所在的包路径从Path移除。

(6)功能、性能探测采用采样的方式进行探测,采样数保存于业务节点配置信息中,可以根据某个业务节点的实际情况进行配置,每次采样的所有相关信息(如请求数据信息、响应数据、探测成功状态、响应时间、业务出现问题时的可能原因等[3])统一写入到MySQL数据库,保证整个探测流程的数据都被保存,以便在业务出现问题时,根据这些信息快速定位问题。

采样示例:以郑州公积金查询应用的性能探测为例,假如性能采样数为10,则表示依次请求10次郑州公积金查询应用,分别记录每次请求的响应时间,然后取10次的平均响应时间(算法详见步骤2)作为本次性能探测的结果得分。

(7)单个业务节点(探测对象)探测流程如图3所示:

步骤2:当功能探测、性能探测完成后,启动告警扫描服务,对当次的功能、性能探测结果数据进行分析扫描[4]。该步骤的规则如下:

(1)告警的判断方式:功能告警是通过功能告警阀值判断,性能告警是通过性能告警阀值判断。

功能告警阀值:用最低采样结果成功数表示。如:某个业务节点的功能总采样数为10,功能告警阀值设置为8,这里的8表示8次采样结果成功。如果该业务节点的10次采样中只有7次的采样满足成功条件,则该业务节点就出现功能告警,否则未出现功能告警。

采样结果成功的判断标准:1表示本次采样成功,业务正常;0表示本次采样不成功,业务不正常。具体在什么情况返回1或0,由具体的探针根据不同业务场景的需要进行定制化实现判断。

性能告警阀值:用最长的平均响应时间表示。如:某个业务节点的性能总采样数为10,性能告警阀值设置为15(单位:秒),当10次采样的平均响应时间大于15(养老查询等7个页面:该业务节点的性能告警阀值)×1000,则该业务节点出现性能告警,否则未出现性能告警。

(2)平均响应时间算法为:

ART=(T1+T2+T3+…+Tn)*1000/n (1)

其中,ART表示平均响应时间,单位为毫秒;T1…Tn表示n次采样中每次采样的响应时间,单位为秒。

步骤3:告警扫描完成后,若发现业务告警则根据系统的全局配置信息,调用短信能力或邮件能力发送告警通知信息,及时告知当前业务运行中出现的问题。短信或邮件信息中包含了出现告警的业务节点的详细信息(如业务访问URL、业务出现告警的原因、探测请求数据、探测响应数据等),这些信息可以帮助维护人员快速定位问题,以便在业务出现问题时快速解决问题[5]。

单个业务节点(探测对象)告警判断过程如图4所示:

4 业务探针系统应用实例

实际应用以郑州公积金查询的普通页面功能探测为例进行说明,具体如表1所示:

5 业务探针系统实践效果

根据以上结构框架及探测流程的业务探针系统,已在河南移动部署并安全运行了一年,较以往拨测系统具有如下优点:

(1)定制化(探针多样化):业务探针技术使用的探针可以根据不同的业务场景、不同的应用及接口,进行探针定制化,以满足个性化的探测需求,现共有拨测189项应用。

(2)业务探测周期时间短:由于业务探针技术采用程序控制探测业务的复杂度,以多线程、自动化方式去完成探测,有效地减少了单次业务探测的时间,单次业务探测耗时下降95%。

(3)具备统计分析功能:采用业务探针技术,可以从多角度、多维度对业务的健康状况进行分析和统计,业务统计指标由原来的3项丰富为10项。

(4)实时性、可控性好:业务探针技术采用多线程探测方式,在控制业务探测周期的同时还保证了业务探测的实时性,且具备探测周期可控制的优点。

6 结束语

本文提出的业务探针系统能够将复杂、低效的拨测规范为自动化操作,通过在河南移动的实际使用,证明了该系统的可实施性和可部署性,能够满足无线城市各接入平台的管理和监测。此外,该系统同样也适用于其他异构多系统的管理和监控。

参考文献:

[1] 高峰,高泽华,文柳,等. 无线城市:电信级Wi-Fi网络建设与运营[M]. 北京: 人民邮电出版社, 2012.

[2] Erich Gamma, Richard Helm, Ralph Johnson, et al. 设计模式:可复用面向对象软件的基础[M]. 李英军,马晓星,蔡敏,等译. 北京: 机械工业出版社, 2005.

[3] 王兴亮,张亮. 基于“无线城市”的无线宽带接入技术应用[J]. 现代电子技术, 2008(21): 16-18.

[4] 张威,汤炳富. GSM交换网络维护与优化[M]. 北京: 人民邮电出版社, 2005.

[5] 赖卫国,许俊禹,胡严,等. 移动无线数据新业务[M]. 北京: 人民邮电出版社, 2007.

作者简介

任昱光:工程师,硕士毕业于北京邮电大学,现任中国移动通信集团河南有限公司计划建设部主管,目前从事移动业务网络规划与管理工作,主要研究方向为移动多媒体,曾组织完成河南无线城市、短信中心、彩铃平台等多项系统建设。

夏冰:讲师,硕士毕业于北京林业大学,现任职于河南职业技术学院,目前从事城市规划与设计工作,主要研究方向为城市规划,曾独立完成北京地区花境数据库建立,参与北京市朝阳区数字化社区建设等项目。endprint

猜你喜欢

探针
基于FANUC数控系统的马波斯探针标定原理及应用
微波共振探针优化
多通道Taqman-探针荧光定量PCR鉴定MRSA方法的建立
BOPIM-dma作为BSA Site Ⅰ特异性探针的研究及其应用
新型生物素标记的苦杏仁苷活性探针的合成
Les consommateurs peuvent-ils rendre des produits sortis de leur emballage ?
透射电子显微镜中的扫描探针装置
新型罗丹明B衍生物荧光探针的合成及其对Al3+的识别研究
小尺寸管式五孔探针研制与校准
扫描近场光电多功能探针系统