APP下载

一种基于NLP的机器人查询系统

2018-11-07廖若飞廖海

电脑知识与技术 2018年21期
关键词:自然语言处理机器人

廖若飞 廖海

摘要:大数据时代的今天,人们渴望通过数据分析精准定位的服务。也由此应运而生了许多优秀的电子产品。

传统的数据查询需要确定数据查询的范围、查询内容、查询条件、展示形式、执行查询,由此来完成一个数据的查询过程。这个过程是相對稳定的、可持续的,因此,我们完全可以让智能的机器人来代替这些繁琐的步骤。我们只需要给出数据查询的相关指令,那么机器人就可以根据使用者给出的指令去完成相应的功能,并以此提取用户感兴趣的数据以及对用户进行必要的分类服务。

另一方面,传统的数据查询已经超出了单一的页面跳转查询范畴,朝着多元化方向发展,不仅包括日常工作、生活中进行的普通查询,也包括很多带有商业目的的且能产生经济效益的查询。而互联网和通讯技术的发展给信息的获取带来了便利,人们可以通过网络进行信息及思想交流。“机器人查询”作为一款以提高数据查询效率为目的的聊天式工具应运而生并且持续发展壮大起来。

关键词:机器人;自然语言处理;查询系统

中图分类号: TP319 文献标识码: A 文章编号:1009-3044(2018)21-0097-02

1 研究背景

智能客服系统是在大规模知识处理基础上发展起来的一项面向行业应用的,适用大规模知识处理、自然语言理解、知识管理、自动问答系统、推理等技术行业。

针对自动问答系统,我们希望开发一套智能问答系统,该系统能够基于给定文档,提取知识并自动生成问答知识库,并能现问答系统(前、后台功能)基本能力。

知识库是智能客服/智能问答系统的关键竞争力之一,高质量的知识库构建是业界难题之一。目前业界大部分智能客服的知识库(QA对\问答对)构建都是通过人工构建,一个完善的知识库构建,需要耗费大量的人力。迫切需要有一套自动化方案,能够根据给定的文档(如产品手册、案例文档、用户指南等)等自动构建知识库(QA对)。

2 功能简介

2.1 产品描述

“小海”是一个基于Web端为主导,以Android或IOS平台为辅助的综合信息查询类App,“小海“不仅支持文字查询,同时还支持语音文字的转换输入。其目标是通过设定多个兴趣标签,如“查学分”、“查天气”、“查车票”等,使用注册的地理位置信息自动匹配相关查询以及消息推送,将多功能单个模块集成在一起,通过聊天窗口形式向用户展现。构成一个线上互动、线下活动的网络查询大平台。

2.2 功能说明

1)消息记录同步,实现用户在切换设备之后还是可以同步到用户其他的移动设备上。

2)即时通讯,实现用户可以通过网络与机器人实时聊天。

3)学分查询,实现用户可以通过软件查询到自己相应的学分信息。

4)成绩查询,实现用户可以通过软件查询到自己相应的各科成绩信息。

5)课程查询,实现用户通过软件查询到自己相应的课程信息。

6)电费查询,实现查询用户寝室相应电费的查询。

7)校园一卡通查询,实现校园卡的余额查询。

8)消息订阅与推送,实现用户对自己感兴趣的内容进行针对性的投送消息。

2.3 产品亮点

1)文档结构树,主题/段落/语句分割。

2)体提取、关键词提取、语义特征提取。

3)句结构分析:同位语结构、动词修饰名词结构、句型分析。

4)要提取、语句压缩和融合。

5)题模式分类。

6)题生成(语义模板法、ML生成法、深度学习)。

7)句泛化:关键词替换。

8)法转化:WH移动、主谓倒置等将陈述句转换为问句。

9)题语义完成度分析。

10)本阅读理解模型。

3 设计与实现

3.1 软件需求

1)拥有用户的注册、登录、聊天、智能查询等基础功能。

2)实现文字、语音的交互通讯功能。

3)实现根据用户查询范围,推荐可用条件、查询模板。

4)支持将查询结果定时、定向地对用户进行推送。

5)支持用户翻阅查询历史。

3.2 约束条件

1)Java环境要求JRE1.8及以上。

2)系统要求Windows Server2000版本及以上。

3)数据库要求MySQL6.0及以上。

4)客户端支持操作系统Windows8.1及以上。

3.3 系统设计

系统设计划分如图1所示。

4 系统测试与评价

4.1 测试结果

对已经完成的功能模块进行了系统的测试,基本上能符合总体需求设计文档中的要求,对所测试出来的问题还需要进一步的修改,但不会影响系统基本功能的实现。

经测试,该系统运行良好。

4.2 总体评价

该系统完成了相应模块的编写及其实现,并且运行效果良好。

参考文献:

[1] 军华, 赵婉婷. 基于手机应用的通信支撑系统的设计[J]. 电脑知识与技术, 2011(30).

[2] 宋小倩, 周东升. 基于Android平台的应用开发研究[J]. 软件导刊, 2011(2).

【通联编辑:谢媛媛】

猜你喜欢

自然语言处理机器人
机器人,让未来走近你
基于组合分类算法的源代码注释质量评估方法
词向量的语义学规范化