APP下载

基于语义识别的自动化家宽报装地址稽核方法

2021-04-03许学研汤斯鹏池鸿源

现代信息科技 2021年19期
关键词:宽带语义节点

许学研 汤斯鹏 池鸿源

摘  要:受到报装关键词匹配程度的影响,对于报装地址的稽核智能化处理存在不足。基于此,提出了基于语义识别的自动化家宽报装地址稽核方法。通过构建语义识别自动化模型,获取到家宽报装地址的识别概率分类;改进清查宽带资源方式,明确报装小区的单元信息与宽带资源能力;基于语义识别算法计算泛化相似词,实现自动化家宽报装地址的稽核目标。实验证明,该稽核方法随着宽带网络节点通信半径的不断增加,地址稽核的分配成功率更高。

关键词:语义识别;自动化;家宽;报装;地址;稽核

中图分类号:TP391.4                 文献标识码:A文章编号:2096-4706(2021)19-0151-03

Automatic Home Broadband Reported Installation Address Audit Method Based on Semantic Recognition

XU Xueyan, TANG Sipeng, CHI Hongyuan

(AI Application and Innovation Center of China Mobile Communications Group Guangdong Co., Ltd., Shantou  515041, China)

Abstract: Affected by the matching degree of reported installation keywords, there are deficiencies in the audit intelligent processing of reported installation addresses. Based on this, an automatic home broadband reported installation address audit method based on semantic recognition is proposed. By constructing the semantic recognition automatic model, the recognition probability classification of home broadband reported installation address is obtained; improve the way of checking broadband resources, and clarify the unit information and broadband resource capability of the reported installation community; based on the semantic recognition algorithm, the generalized similar words are calculated to realize the audit goal of automatic home broadband reported installation address. Experiments show that with the increasing communication radius of broadband network nodes, the allocation success rate of address audit is higher and higher.

Keywords: semantic recognition; automation; home broadband; apply for installation; address; audit

0  引  言

家裝宽带的报装地址稽核方法是满足用户需求的重要渠道,由自动化家宽报装人员建立的安装服务工作的重要载体。传统的地址稽核模式,稽核结果的形式存在一定的差异,受到稽核人员与报装业务种类的影响,对于自动化家宽报装地址的稽核具有一定的不可控性[1]。在稽核家宽地址时,受到报装关键词匹配程度的影响,对于报装地址的稽核智能化处理存在不足[2]。语义识别处理技术通过自动判定家宽报装地址,对于地址进行智能化分析处理,基于统一化标准要求,实现集人工与智能相协调的稽核检查方案[3]。采用同义词相似度计算的方式,将家宽报装地址的关键词与标准要求中的关键词进行相似度类比。语义识别技术可以实现关键词语义相似度计算与识别的目标。在语义识别的自动化家宽报装地址的稽核中,通过片段模式分级,逐级分解网络地址的结构,通过边界识别与地址分类,使地名与网络结构的名称识别F1值达到总体识别结果的95%以上。在稽核过程中,语义识别的自动化稽核方法属于垂直行业属性,以庞大的网络工单为稽核对象,以工单的文字内容进行特征性关键词提取,基于语义自动化识别与语义泛化技术,输出地址稽核的相似程度与工单的合规置信度数值,智能化识别升级家装宽带的报装地址,完善传统稽核方法关键词识别方面的不足。

综上所示,本文提出了基于语义识别的自动化家宽报装地址稽核方法,基于相似度算法与语义识别算法,构建集自动化与智能化融合的关键词识别机制,实现报装地址的快速稽核目标。

1  基于语义识别的自动化家宽报装地址稽核方法设计

1.1  构建语义识别自动化模型

在设计语义识别的自动化家宽报装地址稽核方法中,首先,本文采用了语义识别分词工具,自动化分词处理基础关键词,综合大量的工单数据,选择深度gram神经网络进行关键词的向量训练。在选用分词工具时,综合考虑相似度的距离与CRF算法,进行报装地址的关键语义信息自动化识别。

根据报装地址工单的标准化内容规定,明确稽核方法的主要关注目标,以及对于稽核处理结果的满意程度与回访结果。在稽核中,工作人员填写的处理本文,利用自动化稽核原则,对家宽地址的特征词进行标注,要求关键词与特征词涵盖语义识别的全部特征。

随机筛选报装地址的EOMS训练语料,通过分词软件对报装地址的关键词进行分词预处理,将自动化家宽报装地址语句分解为多个单词的形式。统一化处理关键词词频,获取到报装地址语料的关键词出现次数。筛选出语料中的所有频率较低的单词,保留频率较高单词,综合处理合并为训练语料语义分析模型。在模型中加入相似度计算文本[4],建立在语义层次上方,计算宽带报装地址关键词的相似程度,构建语义识别自动化模型主要依据word2Vec算法,word2Vec算法是神经网络算法中的一种,包含输入层、报装地址稽核隐藏层与识别结果输出层。模型通过预测识别结果的关键词与搜索词,在当前提示词的指引下,完成家宽报装地址的具体预测识别。

在家宽报装地址的数据信息量较少时,以向量模型的训练词为构建的核心内容;在数据信息量较多时,使用CBOW模型原则的训练词作为模型的主导向量,基于识别模型的工单原始数据处理经验,选择适当的训练词构建模型。分批次地划分模型的迭代过程,在语义识别自动化模型的基础上,进行模型的自适应度训练。设置取词窗口的预测数据为k,则识别关键词训练的单词为Wt,设置模型的整体结构中存在一定数量的关键词,家宽报装地址的一维向量随之改变,将训练模型中所有向量输入到模型中。关键词经过模型中的隐藏层,优化分解处理后流经输出层。

在报装地址的稽核预测时,自动化识别模型的隐藏层向量与输出层的权重,经过语义识别软件的变换作用,最终获取到家宽报装地址的识别概率分类。

1.2  改进清查宽带资源方式

基于上述构建的语义识别自动化模型,获取到家宽报装地址的识别概率分类,进行宽带资源的清查工作。传统的宽带清查方法主要以人工清查方式为主[5],在实施过程中具有一定的限制性。本文设计的清查宽带方法以实现自动化清查为核心目标,改善传统清查资源方法的不足。

创建用户的级别标准地址,建立宽带资源数据库脚本,利用关键词搜索分析方法拆分宽带安装的标准地址。根据宽带地址的省市清查人员统一整理数据,明确无规定地址要求,提交给具体的省份地址维护人员,宽带资源清查人员进行统一的稽核验证入库,将拆分好的宽带地址进行综合扩展,将级数扩展到具体的数据层次。控制家宽报装地址的自动集成设备,建立设备与具体安装地址的绑定关系。建立统一标准的报装地址库,如图1所示。

图1  统一标准的家宽报装地址库结构

如图1所示,依据家宽地址标准分级,建立报装地址标准化清洗数据库,通过地址分级标准模型,采集报装地址库模板,定期稽核家宽报装地址的准确性,按照一定的计划要求,分批次地完成报装地址由清洗库到正式地址库的转变。利用BSS/CBSS资源管理方式,接入集成设备,改进宽带地址管理的配套方式。基于搜索引擎库,创建全新的索引与报装地址字段,将所有用户的报装地址数据录入到搜索引擎库中,实现统一标准化的自动化家宽报装地址库的数据录入工作。

依靠地图搜索定位指定报装地址的小区信息,根据地图的定点选择网址,匹配到报装小区的网格,通过网格获取小区的具体名称与数据。再将网格小区的具体名称输入到搜索引擎库中,定位具体的楼栋单元信息,连接资源能力信息接口,获取楼栋单元宽带的准确资源信息。

改进清查宽带资源的方式,能够有效地提高宽带安装业务办理流程的简便性,减少报装地址输入查询消耗的时间。通过标准统一的报装地址库,自动匹配报装地址的结果,不需要输入完整复杂的地址,输入关键词即可快速地定位报装小区的楼栋单元信息与宽带资源能力。

1.3  基于语义识别算法计算泛化相似词

通过改进清查宽带资源的方式,获取到报装地址小区楼栋单元的准确宽带资源信息,利用训练语句得到的单词向量,结合语义识别算法[6],计算家宽报装地址中的泛化相似词。设置泛化相似词的向量为A和B,向量A是[A1,A2,…,An],B是[B1,B2,…,Bn],余弦相似度计算公式为:

(1)

其中,n表示相似度常数;i表示稽核地址关键词分类,对于所有的稽核地址关键词来说,计算与报装地址库相关的自动识别相似度,根据余弦进行排序,得到若干个关键字单词,作为泛化相似词。以ZigBee网络路由算法为基础,设定宽带协调器与路由节点的最大数量,计算分配报装地址的空间,定义地址的偏移量函数。将本文构建的语义识别自动化模型中的节点进行网络地址分配,使得所有节点将地址模块平均分配[7]。设置最大子节点数为Cmax;接入节点数为Rmax;宽带网络最大深度为Lmax,宽带网络地址空间的计算公式为:

Cmax(d)=1+Cmax×(Lmax-d-1)          (2)

式中,d表示网络通信节点的深度,如果宽带网络节点的计算结果为0时,表明网络宽带通信地址在空间上没有产生偏移量,能够作为宽带报装的地址块。如果计算结果大于0时,表明其能够作为宽带报装子节点接入互联网并进行报装地址分配。

基于语义识别算法计算泛化相似词能够保证地址模块的均匀分配,适用于家宽报装以及其他的自组织网络,能够在分配地址范围内连续分配宽带报装地址空间。设计算法的伪代码为:

def LFM(user_items, F, N, alpha, lambda):

#初始化P矩陣

P = InitModel(user_items, F)

#开始迭代

For step in range(0, N):

#从数据集中依次取出user以及该user喜欢的iterms集

for user, items in user_item.iterms():

#随机抽样,为user抽取与items数量相当的负样本,并将正负样本合并,用于优化计算

samples = RandSelectNegativeSamples(items)

#依次获取item和user对该item的兴趣度

for item, rui in samples.items():

#根据当前参数计算误差

eui = eui - Predict(user, item)

#优化参数

for f in range(0, F):

P[user][f] += alpha * (eui * Q[f][item] - lambda * P[user][f])

#当优化到一定程度后,就需要放慢学习速率,慢慢地接近最优值。

2  实验分析

2.1  实验准备

为了验证本文提出的基于语义识别的自动化家宽报装稽核方法的有效性,本文进行了如下实验,通过稽核报装地址的自动测试,检验语义识别自动化稽核结果的准确率与工单重派率指标。本次实验选取辽宁省某EOMS无线宽带网络企业,采集2 000张报装工单作为实验的验证集,报装工单中需包含语义识别的结构化字段。保证实验的验证集来源的可靠性,使构建的模型能够适应不同报装地址的环境条件,实现报装地址的广泛覆盖要求。设置宽带网络的覆盖面积为500 m×500 m,在覆盖范围内网络节点具有不同的密度,设置N个网络节点随机分布在报装地址小区中,保证每个报装地址环境中具有一个宽带安装协调器,并处于网络覆盖中心位置,固定语义识别自动化模型的网络深度为8,在网络节点通信半径与其他参数条件不变的情况下,观察通信网络节点数量对宽带安装地址分配的影响。连续进行50次语义识别的自动化地址稽核实验,取实验结果的平均值作为稽核结果的实验参数,如表1所示。

2.2  结果分析

设置本文提出的基于语义识别的自动化家宽报装地址稽核方法为实验组,传统的神经网络地址稽核方法为对照组,对比两种稽核方法的分配成功率结果,如图2所示。

如图2所示,随着宽带网络节点数量的不断增加,本文提出的自动化家宽报装地址稽核方法的地址分配成功率上升的速度更快,宽带节点的数量与宽带节点通信半径呈正相关变化,较传统的地址稽核方法相比,地址分配成功率更加具有优势。

3  结  论

本文提出的基于语义识别的自动化家宽报装稽核方法,避免网络宽带安装过程中产生孤立节点,促进报装地址分配得更加灵活。传统的地址稽核方法受到宽带网络节点不确定性的影响,在报装地址稽核中消耗了大量的时间精力。本文提出的稽核方法,经过实验证明,在宽带网络节点通信半径的不断增加下,家宽报装地址的分配成功率更高,有效地提高了地址稽核的效率与成功率。然而,由于研究时间有限,本文提出的稽核方法在具体的实施过程中仍然存在一定的不足,在未来的研究中应当加以改进。

参考文献:

[1] 黄堃,赵东明.电信运营商网络投诉工单智能语义稽核技术 [J].电信工程技术与标准化,2021,34(7):45-49.

[2] 韦芹余.IP地址精细化管理系统建设方案研究 [J].江苏通信,2021,37(2):63-65.

[3] 李汶澍.基于微信公众号的家庭宽带智能装机助手 [J].通信世界,2021(4):37-39.

[4] 田兆丰,王歌吟.基于ElasticSearch智能搜索引擎的宽带线上选址平台的设计与实现 [J].通信与信息技术,2020(4):28+33+24.

[5] 王小峰.家庭宽带光纤接入技术应用与实现 [J].中国新通信,2019,21(6):96-97.

[6] 李铁坚.基于GIS的电信网络资源的标准地址快速上图方法研究 [J].通信电源技术,2019,36(2):211-212.

[7] 陶轶,许锡明,房志辉,等.运营商基于QoE的家庭宽带指标感知体系 [J].现代电信科技,2017,47(4):68-73+78.

作者簡介:许学研(1985.04—),男,汉族,广东汕头人,工程师,硕士研究生,研究方向:大数据建模、数据挖掘、人工智能算法建模。

猜你喜欢

宽带语义节点
我国行政村、脱贫村通宽带率达100%
韩国语“容入-离析”关系表达及认知语义解释
浅析提速背景下宽带覆盖场景方案
基于移动汇聚节点和分簇的改进节能路由算法
CAE软件操作小百科(48)
基于点权的混合K-shell关键节点识别方法
宽带网络将覆盖90%以上贫困村
福建:六大行动计划力促宽带再提速
浅谈基于P2P的网络教学系统节点信息收集算法