APP下载

问答系统及其应用案例分析

2020-12-28白祎铭

神州·上旬刊 2020年12期
关键词:知识图谱旅游

白祎铭

摘要:在进行高级信息的检索时较为常用的为问答系统,该系统可以对用户所需提问的问题进行理解并给出答案。本文对问答系统的定义、发展背景和发展历程进行了阐述,之后通过旅游领域、军事领域中的两个具体案例介绍了问答系统的应用情况及构建方法,最后分析了问答系统面临的挑战与未来发展方向。

关键词:问答系统;知识图谱;旅游;军事科普

1 引言

在日常生活中,人们希望能够实时、精准的获取所需信息。随着信息技术的发展与应用,互联网已经成为社会生活的重要组成部分。借助互联网,人们可以随时随地进行沟通、发布动态、网上购物等经济、生活行为。与此同时,人们在互联网上的各种行为也被记录下来,互联网上的信息随之呈井喷式增长。如何从这些海量信息中获取用户需要的内容,解决信息过载问题是当前信息检索领域面临的难题。为了将信息、知识精准地推送给用户,研究者开始设计一种高级信息检索系统——问答系统(Question Answering System,QA)。问答系统是用户采用自然语言的形式给出想要检索的问题,系统通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得到答案。用通俗的话来讲,就是用户直接输入想问的问题,机器通过运算将准确的答案用自然的语言反馈给用户[1]。

问答系统能够用自然的语言,简洁、准确地回答用户所提出的问题,其在人工智能领域备受关注,同时具有广泛的发展前景。目前,问答系统已在多个领域进行了初步运用并得到了广泛关注。在淘宝、京东等电子商务平台,已经广泛使用了智能客服机器人,智能客服能够快速处理客户的问题,这些问题主要是一些简单、重复性的问题。相比传统的人工客服,智能客服的成本较低,且能够24小时不间断工作。聊天机器人是问答系统的升级,其不仅可以回答用户的问题,还能与用户进行人性化对交流,仿佛是用户的一个好朋友。当前,聊天机器人在商业领域很常见,如苹果公司推出的移动个人助理Siri,阿里巴巴的聊天机器人等。本文将对问答系统的发展应用进行分析,以期为其未来发展提供借鉴。

2 问答系统的发展历程

1950年,英国数学家图灵在其论文中提出并研究了一个十分有意思的问题,即测试机器是否具有智能,并提出了判定机器能否思考的方法——图灵测试。其测试内容为:房间1中有测试人员,房间2中有一名人类和一台机器,被测人与房间2中的两个对象进行对话,若测试人员无法对房间2中的对象做出属性判断,那么可以初步判定该机器具有智能性。

1966年,Weizenbaum设计了第一个公认的问答系统,其名为“Eliza”。Eliza被设计为一个心理学专家,采用启发式心理疗法,能够与患者进行对话。其原理是通过提出问题,引导病人说出心里的不适,从而达到治疗的效果。1970年,耶鲁大学人工智能实验室研制出一套阅读理解系统,该系统名为Sam。Sam的能力受限于其预先准备的问题及答案脚本,当脚本未准备好时,系统将无法工作。

在1990年,传统模式的问答系统主要依靠于文档集,随着信息技术的发展,现今的系统基础也发展为互联网数据,但此时面向Web开放域的问答系统其回答的正确率与精准性较低,用户体验不佳。近年来,深度学习技术在自然语言处理领域中的应用越来越多,而基于深度学习技术的问答系统其系统性能往往更好,也是目前研究的热点。

目前国内的企业与研究团体也推出了许多问答系统,如在电子商务平台——淘宝上广泛应用的智能客服、百度公司推出的小度机器人、知识问答社区——知乎的智能回答等。由于中文区别于英文没有天然的分词,其在问题理解方面相比英文难度较大[2],此外,国内在自然语言处理领域起步较晚,技术相对薄弱。因此,相比国外的研究水平,国内还存在一定的差距。

3 问答系统的应用

3.1旅游问答

随着人民生活状况不断改善,越来越多的人们会在休闲时间选择旅游来放松心情、增长见识。而到一个旅游景点时就不免要在去之前对它背后的历史、文化知识进行了解。在现今所使用的大多搜索工具几乎都是在用户进行搜索后根据所输入关键词呈现相关网页,这样的方式会造成答案片面化的情况。况且有的景点背后存在着许多与之相关的事件、人物。因此,如果在旅游领域引入问答系统将为游客进行路线制定、相关知识科普带来极大的便利。

针对“靖江王府”相关的文化知识,桂林电子科技大学的研究人员设计了一套问答系统[3]。这一问答系统是基于知识图谱的,系统的构建分为三步:知识图谱构建、问句分析、答案生成。

第一步,信息获取。研究人员首先用网络爬虫自动获取景点基本信息以及真实的用户问答内容,解析相关内容,之后将提取的有用信息保存到知识库中,接着再查阅相关历史文献完善知识库。然后构建知识图谱,知识图谱是将知识点以及它们之间的关系结构化、可视化,知识图谱的构建能够对相关的概念进行精确描述,为后续的问答生成提供知识基础。

第二步,问句分析。首先进行问句分词,这是将中文自然语言转换为结构化语言的基础模块。然后进行同类词替换,需要预先构建一个同类词词典,使问句中的语义词统一为一个表达方式,减少由于用户语言习惯带来的差异,从而提高查询准确率。最后是很重要的一步——问句相似度计算。通过计算用户输入部分与模板相似度能让返回的答案更加快速、准确。

第三步生成答案。在这个系统中使用的是多策略检索方式,在生成答案前进行相似度计算将问题与知识库中模板进行比对。如匹配则直接返回问答对模板中的答案。不匹配就在知识图谱中查询生成答案。

系统实现包括三个部分:获取和整理网络信息的数据获取与存储模块、处理输入输出语言的问答模块、通过简洁的界面帮助用户获取信息的人机交互模块。研究人员最终进行调试与运行证明了该设计是可行的。

可以看到基于知識图谱的问答系统很好地解决了游客关于旅游景点的问题,兼具准确性与速度。下一步只需扩增它的知识图谱及知识库就可以应对更多用户问题。

3.2 军事科普问答

军事科普领域需要的问答系统具有准确性以及专业性并且往往需要通过深度推理准确理解问题和生成答案。传统的浏览器及开放领域问答系统都无法满足需求,前者准确性不高,后者则缺乏开放知识源。同时由于军事类的特殊性,问题的形式远少于开放域问题。那么问答系统的构建难点就落在了构建知识图谱以及推理求解的过程上。

窦小强等[4]设计了一个基于军事知识的智能科普问答系统。该系统的构建最重要的两步就是相关军事知识图谱的构建以及问答系统设计。

第一步构建军事知识图谱。首先要解决知识来源不统一带来的模式层不同的问题。文中通过建立一个标准的模式层分类体系,自动转化的模式层通过语言学判定上下位、类属、并列等关系建立联系,达成语义上的统一。由于图数据库与查询比文件查询在大数据面前更加高效,不仅能节省时间而且可以为以后数据库的扩展打下坚实基础,因此系统采用图数据库存储相关的知识。将每个知识图谱上的边和点对应到图数据库上,不仅能体现高效性与可操作性,同时使得语义信息得以完整保存。图数据库建好之后,调用知识图谱时只需要使用图数据库的查询语句即可。

第二步就是设计问答系统整体架构。同旅游业中介绍的问答系统类似,由问题理解、问题求解和答案生成三个模块组成。在问题求解过程,系统将问题进行分类处理:第一类是直接输出查询结果就可以的;第二类是基于查询结果进行逻辑推理得出答案;第三类是基于推理得到模糊答案的问题。这样针对每类问题都可求解。

该系统已经基本实现了几类问题的自动回答,可支持部分交互应答,并将蕴含查询结果的知识图谱可视化。该系统利用多种来源的知识,生成知识图谱,经过问题理解、查询后返回答案。对专业领域的问答系统的构建具有一定指导性。在这个系统的处理用户提问中的处理方式让人眼前一亮,比如在用户提问的答案有好几种结果时会将多个答案用自然语言返回给用户,从而进一步缩小答案范围,更加便利。

4 结语

目前来看,小范围特定领域应用基于知识图谱的问答系统可以更加高效、结果更加准确,但是仍有一些缺陷:难以十分精准地理解自然语言,以及知识图谱建构方面的成本、准确性问题。构建一个规模稍大的知识图谱,首先要提取数千个数据样本,由业内专家标注它们之间的关系,之后进行机器学习,实现自动、半自动的标注。这个过程需要投入不少人力,比如:自然语言学习师、大数据工程师。动辄几百万的造价使得问答系统的普及较为困难[5]。

自然语言的问句理解是问答系统构建的瓶颈问题。问句理解是要将用户的问题转换为计算机能够理解的形式。由于用户的自然语言表述受到个体语言习惯、文化等的影响,是不断发展变化的。其不仅仅是问答系统面临的难题,也是人工智能领域所需要解决的最核心的难题之一。

此外,答案的生成也是问答系统面临的难题。目前,基于知识图谱的问答系统发展迅速,但如何从知识图谱中推理生成准确的答案仍然面临许多挑战。目前的问答系统仅能处理简单问题,对于一些复杂的问题的回答还面临许多技术难题。

当上述问答系统面临的技术、成本问题得到缓解甚至解决时,问答系统的便捷以及准确性就会凸显出来,其应用的范围也会进一步扩大。虽然问题系统的发展面临许多困难与挑战,但其未来的发展前景是广阔的。

参考文献:

[1]王瑛,何启涛.智能问答系统研究[J].电子技术与软件工程,2019(05):174-175.

[2]李沛晏,朱露,吴多胜.问答系统综述[J].数字技术与应用,2015(04):69+71.

[3]时雨,古天龙,宾辰忠等.基于知识图谱的旅游景点问答系统[J].桂林电子科技大学学报,2018,38(04):296-302.

[4]窦小强,刘天雅,张志政.基于军事知识图谱的问答系统[C].中国指挥与控制学会.第六届中国指挥控制大会论文集(上册).中国指挥与控制学会:中国指挥与控制学会,2018:537-541.

[5]劉里,曾庆田.自动问答系统研究综述[J].山东科技大学学报(自然科学版),2007(04):73-76.

猜你喜欢

知识图谱旅游
我们一起“云旅游”
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
出国旅游的42个表达
户外旅游十件贴身带