APP下载

基于自然语言处理的电力客服系统研究

2021-10-21卢致亮匡先进曾赵锦

中国新通信 2021年17期
关键词:自然语言处理

卢致亮 匡先进 曾赵锦

【摘要】    自然语言处理是IT技术重要的创新之一,本文针对电力客服系统的需求,结合自然语言处理技术讨论了一种电力客服系统设计与实现过程。讨论了系统构建过程中涉及的实现模式、系统组件、核心算法等内容。该系统以电力服务为知识库数据源,利用自然语言处理技术进行分词及词向量转换,利用知识库训练并构建模型,最终完成电力智能客服系统的构建,其运行效果良好。

【关键词】   自然语言处理    智能问答    电力服务

引言:

人工智能技术在飞速发展,并迅速应用于各行各业。电力系统关系到国计民生,人工智能在电力系统中的应用必将有效提升电力运维的效率与安全。人工智能系统与电力系统的融合体现在诸多方面,本文以电力智能客服系统的设计与实现为切入点,将自然语言处理技术应用于电力系统的自动运维,使电力系统的运维向自动化、智能化方向发展。

智能手机的普及让用户希望拥有更便捷的信息获取方式和更人性化的人机交互体验。此背景下,我们进行了电力客服系统的研究与开发,在工单大数据技术的助力下,构建了一个能够快速吸收和利用已有知识的对话理解模型,对用户的问题通过自然语言处理技术进行分析,采用机器学习方法构建和优化问答模型,构建出一个高效、准确的智能问答系统。

本文组织如下,首先介绍了电力客服系统的研究意义,并对当前国内外研究现状进行了分析;然后讨论了相关系统组件、核心算法、自然语言处理方法;最后给出了电力智能客服系统模型的构建流程。

一、研究现状

智能问答系统可以定义为能与人进行对话的应用程序,即采用文字、语音来与计算机进行交互的问答系统。问答系统的发展经历了漫长的历史。

1988年,Berkeley研發了聊天机器人UC[1],该系统通过自然语言交互界面为用户使用系统提供帮助。此后延伸出多种类似系统,如 YAP[2]用于电话信息查询,CSIEC[2]则用于学习辅助。

国内,中科院于1998年构建了第一个人机对话系统[3]。初期的问答系统常限定于某特定领域,结合知识库和推理机而形成专家系统(ES)[5]。

在电力系统运维方面,目前应用于电力系统的方法有神经网络[4]、模糊集理论[6]等。神经网络具有良好分类性,被广泛应用于电力系统的监测、诊断、实时控制、符合预测以及状态评估等不同的领域[7]。模糊集则可完成传统数学方法难以描述的模糊计算问题,目前已应用于电力系统的系统规划、模糊控制等方面[8],这些方法在构建智能问答系统方面也具有较大的潜力。

当前,越来越多的公司、研究机构在进行智能问答技术的研发,如微软、苹果、剑桥大学等,工业界和学术界已产出一些比较成熟的智能问答系统。实际中,电力客服系统因其友好、便捷和及时的特点而迅速受到客户的认可。

三、系统架构

电力客服系统是智能问答系统中的一种特殊应用,该系统涉及自然语言处理、工单数据分析以及问答模型构建,其关键算法涉及NLP的语义分析和情感分析。

3.1电力客服系统实现模式

问答模型分为两类,一类通过遵循特定规则来生成答案;另一类则使用人工智能方法生成答案。

3.1.1基于规则的系统

该模式的标准结构由人工智能标记语言(AIML)构建,其局限是只能理解其编码范围内的问题,预定义的问答规则定义了客户与系统对话的范围,答案仅出现于匹配模式中。基于规则的系统更易构建,因其使用简单的算法来理解用户输入并查询相应的答案,适用于系统中基础知识的问答。

3.1.2基于机器学习的系统

该模型使用机器学习算法进行训练,通过自然语言处理技术来理解特定问题并生成相应的答案。系统开发时采用知识库来存储并描述系统的角色,用对话记录进行模型的反复训练,算法结合模型与新收到的话语自动生成匹配答案。其特点是能理解自然语言,并可在对话过程中持续学习以提升其智能化水平。

3.2电力客服系统的组件

整个系统因涉及不同的异构组件而变得复杂,其系统结构取决于多种因素,如问答内容的用例、领域以及系统类型等,系统的关键组件如下:

3.2.1问答系统

问答系统负责回答客户的常见问题。客户的问题由问答系统进行解释,答案则来自知识库的匹配,知识库的构建可用手工训练或自动训练方式。手动训练需要领域专家编制常见问题列表并描述其答案,系统基于此列表来匹配近似问题并查询得到相应答案。自动化训练则需要向系统传递训练数据,如工单,知识库由训练得到,问答引擎生成问题和答案的对应列表并据此对问题自动匹配其答案。

3.2.2自然语言处理

自然语言处理技术将用户的消息上下文化,其作用是理解用户表述的内容,并将其转换为计算机能识别和处理的信息。

NLP涵两个部件,即意图分类器和实体提取器。意图分类器在输入内容和回答内容之间构建映射关系;实体提取器负责从用户的输入中识别关键字,帮助确定用户的操作意图。

NLP引擎还包含反馈机制和学习策略。反馈机制是用户为系统提供的反馈信息,它可纳入评价系统中,即用户在对话结束时对交互系统进行评分,以此激励系统进行改进。学习策略是一种泛型学习框架,系统经训练后可以在对话中创建更为通用的网络模型。

3.2.3前端系统

前端系统是用户与电力客服系统交互的系统,它是面向客户的系统,如微信、门户网站或移动APP等。

3.2.4节点服务器/流量服务器

服务器接收用户请求并将它路由至相应组件,内部组件的响应通常流量服务器路由至前端系统。

3.2.5后端集成

电力客服系统可与现有的后端系统(CRM、数据库、支付系统等)集成,以增强电力客服系统的整体功能。

3.3电力客服系统核心算法

电力客服系统可采用不同分类模型来工作,核心模块包括自然语言理解和自然语言处理。

3.3.1算法模式

算法用于构建分类器和创建问答模型,复杂结构由多个问答模型组合迭代而成。神经网络用权重向量来连接输入与输出,如前所述,NLP处理输入时每个句子都会被分解为单词,每个单词都会用作神经网络的输入,通过训练数据的多次迭代计算其加权连接,每次计算都使答案更准确。对于新输入的句子,它的分词会被计算频次和特征,进而进行推断,得分高者最有可能与输入相关联,即为答案。

3.3.2自然语言理解

自然语言理解(NLU)通过分解查询信息来帮助系统理解用户请求。它有实体、意图和上下文三方面内容。

实体是系统从用户查询中提取的关键字,用以了解用户的需求。意图则有助于系统识别用户输入所对应的操作。上下文用于关联提问意图,而舍弃对问题本身的分析和记录。上下文对于NLU算法而言极其重要,若分析对话的历史则需存储对话中所有的问题,随着数量的增加,分析过程变得异常复杂,使用上下文则可抛弃对对话历史的存储转而记录对话状态。

3.3.3自然语言处理

自然语言处理(NLP)是将客户的文本、语音转换为结构化数据以筛选相关答案的过程。该过程涉及情感分析、标记化、规范化和依赖解析等。

情感分析算法通过读入实体来理解用户的情感。标记化是将一组单词分成片段的过程,使其在语言上具有极强的语义征性。实体识别是模型需要查找的单词类别,如产品名、用户名或地址等。规范化是处理用户输入中常见错误的过程,它使系统不会因为用户的误输入而误导整个服务流程。依赖解析是在用户输入的文本中查找对象的主语、动词、名词和常用短语的过程,由此找到用户意图的依赖关系。综上,NLP将自然语言翻译成特定模式的文本组合,通过该组合来映射最优答案。

四、结束语

本文讨论了基于自然语言处理的电力客服系统的设计与实现方法。该系统从运维的实际需求出发,以提供良好的服务为目的,将自然语言处理技术应用于电力运维系统中客服问答系统的构建。

实际中,电力客服系统为无限量的用户提供大规模的实时连接并像人一样与客户交互,使客户轻松获得优质的服务和良好的体验。企业通过该系统可以高效地完成自动运维工作,从而节约资源和成本,其经济效益显著。

参  考  文  献

[1] Robert Wilensky, David N. Chin, Marc Luria, James Martin, James Mayfield, and Dekai Wu. The Berkeley Unix Consultant project.Computational Linguistics, 14(4), 1988.

[2] Lovis C Wagner J Griesser V Michel PA Scherrer JR. Baud RH, Rassinoux AM. Knowledge sources for natural language processing.Proc AMIA Annu Fall Symp, 70(4), 1996.

[3]初敏. 人机对话系统工程. 中国科协青年学术年会, 1998.

[4] Computing Machinery. Computing machinery and intelligence-am turing. Mind, 59(236):433, 1950.

[5] Buchanan B. G. and Heuristic DENDRAL. A program for generating expiator hypotheses in organic chemistry: Machine intelligence.Edinburgh: Edinburgh University Press, page 209, 1969.

[6] Lotfi A Zadeh. Fuzzy sets. In Fuzzy sets, fuzzy logic, and fuzzy systems: selected papers by Lotfi A Zadeh, pages 394–432. World Scientific, 1996.

[7]刘秀玉, 刘峤, 王日见, 张少华. 一种基于模糊逻辑和神经网络的电力负荷预测方法. 上海大学学报(自然科学版), 2001(01).

[8]严华, 吴捷, 马志强, 吴列鑫. 模糊集理论在电力系统短期負荷预测中的应. 电力系统自动化, 2000(11).

通信作者:卢致亮,(1985.6- ),男,汉,江西省南康,大学本科,工程师,主要研究方向为电子信息。

猜你喜欢

自然语言处理
基于LSTM自动编码机的短文本聚类方法
自然语言处理与司法案例
国外基于知识库的问答系统相关研究进展及其启示
基于依存句法的实体关系抽取
基于组合分类算法的源代码注释质量评估方法
面向机器人导航的汉语路径自然语言组块分析方法研究
词向量的语义学规范化
汉哈机器翻译中的文字转换技术研究
HowNet在自然语言处理领域的研究现状与分析