人工智能时代背景下自然语言处理技术的发展

2020-02-21孙伟博张斌

电子技术与软件工程 2020年13期

孙伟博张斌

摘要：本文介绍自然语言处理的相关技术和应用，进一步探索自然语言处理技术的发展前景，以促进自然语言处理技术的不断发展，应对新时代的诸多挑战。

关键词：计算机技术;自然语言;处理技术;编程语言

自然语言处理技术就是使用计算机对自然语言的声音、形状和含义进行处理。它以单词，句子和文本为对象来执行一系列的操作和处理，包括输入、输入、识别、分析、理解、生成等，自然语言处理过程主要涉及两个方面：理解和生成。第一个涉及使用计算机实现自然语言理解，第二个涉及使用计算机支持的自然语言来表达意图。

1 自然语言处理

1.1 自然语言处理技术概述

自然语言处理技术由于其巨大的应用环境和发展潜力，己成为语言学、计算机科学和数学等专业的交叉学科。人类可以使用自然语言来传达思想，并在人际交流和社会组成中发挥巨大作用。此外，人类还使用自然语言来思考和理解事物的本质和规律。人类没有表达手段就无法思考，人类每次思考实际上就等于与自己对话。可以说，没有自然语言，人类社会的科学技术的发展就不可能有序地进行。自计算机诞生以来，人与计算机之间的交互只能通过以编程语言（例如Basic，Pascal，C，Lisp和其他计算机编程语言）编写的代码来实现。就计算机而言，它只能基于二进制指令来响应不同的行为。程序员通常在此过程中扮演翻译角色，计算机可以完成我们想做的任务，但是不懂我们的语言。如果计算机能够直接理解我们的命令，这就是为什么自然语言处理是人与计算机之间的桥梁。

1.2 自然语言处理技术困难

为了解释自然语言处理过程中遇到的困难，我们可以从编程语言和自然语言之间的区别入手。用编程语言编写代码实际上是使用该语言提供的元结构来组织、构建和创建新模型。所谓的元结构是编程语言中必不可少的基本指令集。程序员可以使用这些指令集执行复杂的组合，以实现其所需的功能。从逻辑的角度来看，程序的设计必须非常严格，因此，这些元结构在开发之初就具有固定且严格的逻辑含义，并且这些元结构的数量是有限的。人类使用的自然语言最大区别在于其逻辑局限性。由于自然语言不是组织开发的，因此它在日常生活中不断变化。因此，任何自然语言的词汇都会增长，并且随着社会的不断变化，词汇也会表现出歧义或改变。数据的巨大增长增加了自然语言处理的复杂性。与只能具有数百个元结构的编程语言相比，自然语言处理的困难显而易见。但是，这只是词汇问题。更为困难的问题是自然语言在逻辑上并不严格。可以使用相同的语法规范组合大量词汇并具有有不同的含义。大量的元结构和难以分析的语法为计算机识别自然语言带来了巨大的问题。

1.3 自然语言处理技术尝试

科学家普遍认为，要使计算机理解我们的语言，首先必须具有人类智能，并且计算机理解自然语言的方式必须与人类相同或类似。受传统语言学的影响，分析句子和导出语义是一种普遍的做法。首先将单词的含义转换为映射关系，然后使用语法规则对其进行分析。在此之前，人类必须手动概括语法规则，然后输入适当的规则，以便计算机可以理解它们。但是，在实践中，发现一些易于理解的句子包含大量的语法规则。这种方法更像是一种笨拙的系统，对于己定义的规则，人类通常认为这些语法规则很难理解。本质上，这是因为自然语言是通过使用出现的，而不是由规则定义的，即使可以完整地找到这样的语法规则，也很难在计算机上使用它们。另外，对语法和单词含义的分析仍然不能解决自然语言的上下文相关特征。当使用编程语言时，由于语法的逻辑非常严格，并且设计过程是设计者将其思想转换为程序可以理解的句子，因此这些功能使计算机可以理解编程语言。就自然语言而言，除了上述问题外，它还与自然语言的语境有关。由于使用自然语言句子来促进人与人之间的交流，因此计算机是否理解它们并不重要。因此，该句子在逻辑上并不严格，在这种情况下，通常必须理解该句子的含义，即使了一句话，也包含了人类社会建立的一些常识或经验。例如：“帮我把书拿到桌上。”如果用语法分析它，很明显，不知道是谁帮助了谁或谁拿了这本书，也就是说，不知道主语和宾语。但是，此类句子通常以自然语言出现。人类当然可以在使用句子时根据上下文知道该句子属于谁，并且他们还可以推断该句子一定是一本“我”的书。某些隐藏信息不会在文本中反映出来，因为人类在看到这些单词时总是可以思考他们在说什么。如果他们需要添加这些隐藏的信息，例如“请帮助我将书从桌子上拿下来”，尽管这是正确的，但在现实生活中似乎有些延迟。更重要的是，如果由于实现上的困难而限制了句子的解析范围，显然与自然语言处理的初衷相去甚远。为了使计算机具有这种感知知识，人类尝试使用逻辑规则来定义这种感知知识。面临以上困境以下介绍当前研究中使用人工智能进行自然语言识别的原理。

2 在自然语言处理技术中的应用

2.1人工智能概述

人工智能指人造机器展现的智能。通常，这种类型的智能是指计算机智能。顾名思义，人工智能的目标是使计算机能夠通过整个系统的分析和设计来显示类似于人类的功能。在本文中，我们将探讨人工智能在自然语言处理中的应用。

2.2 控制论与大脑模拟

正是因为人类的发明都源于对自然界中现有结构的模仿，因此人脑是实施智能脑系统的最佳指南。控制论和大脑模拟的方法是研究神经学、信息论和控制论之间的联系，以在计算机中实现像人类神经系统这样的智能系统。实际上，这是生物过程的计算机模拟。但是由于人脑过于复杂，人类仍处于大脑研究的愚昧阶段。模仿的前提是必须完全理解。人工智能可以在这个方向上实现什么，很大程度上取决于人脑研究的进展。显然，目前这种研究人工智能的方法无法给出良好的结果。

2.3 字符处理

得益于计算机设计语言的成功，人类开始研究“智能”的实现是否可以由类似于计算机设计语言的逻辑符号表示，这些逻辑符号与开始时介绍的传统自然语言处理技术类似。但是，无论是智能实现还是自然语言处理，都非常复杂且逻辑上并不严格。这些特征与字符处理的逻辑定义和表达相冲突。因此，许多人认为字符处理永远无法模仿人类的认知过程，尤其是与学习和感知有关的一些非理性部分。

2.4 统计学方法

当前，在人工智能领域中，使用复杂的数学工具来解决特定的拆分问题是一种流行的研究方法。其中，一种著名的算法是机器学习算法，它是一种自动分析数据从中提取规则并使用规则预测位置数据的算法。从机器学习实现的一般概念可以看出，机器学习与输出统计尤其相关。该算法不需要对大脑模拟，也不需要人工集成或字符处理，仅使用大量数据，计算机可以自行学习，从而大大降低了开发人工智能相关问题的复杂性。通常，机器学习课程分为监督学习和无监督学习。两者之间的区别在于用于训练的数据是否手动标记。监督学习通常使用以下步骤从数据集中构建评分系统，训练有素的人工智能系统会根据给定的数据集做出判断，然后手动评估得出的判断，更正确的判断将给结果更高的分数，相反，更低的分数是不希望的结果。通过这种不断的反馈和调整，对AI系统进行训练，使其做出倾向于给出更高等级的判断并执行类似于人类的判断，即常规意义上的“智能”。对于无监督学习，系统通常使用聚类分析来自动检测未标记数据集的固有关系（也就是说，数据结果尚未经过任何手动预处理）。此外，由于这两种方法缺乏精确的线索和结果，它将为每个可预测的步骤和行为提供反馈，从而增强了系统做出更“智能”选择的趋势。

3 自然语言处理技术的应用

3.1 个性化智能推荐

在电子商务的发展中，信息处理面临着信息过载的问题。用户如何在快速增长的资源中准确找到所需的信息是一个重要的问题，就像公司必须为用户提供准确且相关的服务一样，有一定的困难。推荐系统的出现在一定程度上解决了这个问题。在系统运行时，它可以监视用户行为，提供产品建议并改善用户决策。个性化推荐可以促进企业与用户之间的交流并改善交互。在新闻服务领域，将根据用户读取的信息内容，篇幅和评论以及其他偏好来更详细地进行数据分析。对关键信息源和关键信息词汇，新闻组织和促销以及个性化新闻服务进行全面，专业的分析，以确保用户体验得到显着改善。

3.2 语音识别技术

基本上，语音识别技术是为了使机器能够理解人类语言并为人类发展做出贡献。根据应用程序的要求将语音内容转换为机器可读数据。在此过程中，有必要智能地分解连续语音并建立规则以准确理解语义。降噪、语音剪切和裁剪都是语音识别技术中的重要过程。该框架可以分为三个方面：声学模型，语言模型和解码。通过不断使用智能技术，人类可是实现智能家居生活，家用电器可以通过红外遥控器进行控制，但是空间位置通常会影响红外辐射的传输。集成设备自动切断电源并自动管理通道，实现了多个远程控制设备的集中化，并且可以通过语音控制实现通用功能。在智能技术的实际应用中，可以实现与智能扬声器的语音交互，并执行各种操作，例如远程控制、问答和在线购物。淋浴期间，可以使用声音调节水温和室外空调的温度。在开车时，手机会不断显示地图并通过智能扬声器拨打电话，这可以减少对驾驶员的干扰。

3.3 机器翻译技术

机器翻译具有强大的自动化功能，在计算机技术的支持下，它将源语言转换为目标语言。随着跨境电子商务的飞速发展，网站上跨境电子商务的发展与网站和应用程序的多语言化紧密相关，用户倾向于在搜索过程中使用自己的语言，但是对于跨境電子商务网站，就不可能进行大量投资来满足用户的独特搜索引擎需求。用户想要找到的类别可以通过网站的内部导航来阐明他们需要的产品。通常，在查看标题后，用户会仔细阅读特定的说明和相关的注释，以获得对产品的更完整的了解。如果语言受到影响，用户将无法访问他们，会毫不犹豫地关闭页面，这将导致用户流失。随着大量信息的产生，信息交互的需求已大大增加。大数据可以用机器翻译，每天在线翻译的实际量超过1万亿个单词。

4 自然语言处理中人工智能框架

通常智能有两个层次的理解：第一层次是基于自我意识，并且具有非常复杂的理性处理能力，例如用数学逻辑推理能力，抽象思维等。第二层次是基于无意识的，内容涉及体验日常生活的能力，例如步行，感知物体和日常活动。可以看出，普通动物具有第二级智能，而第一级智能人类可用。智能的定义应包括对这两种智能的理解。因此，人工智能的目的可以被认为是提供一种可以解释意图性的一般类别及其基础的系统理论，使用语言是智能的重要特征。深入探索自然语言理解非常有用。从更广泛的角度来看，理解自然语言需要哲学家、语言学家、心理语言学家和计算机科学家的合作。所使用的知识是多层次的，包括语音知识、词形知识、句法知识、语义知识、语用知识和世界知识。从务实的角度来看，理解自然语言是主体以感知形式对世界的表示，它具体反映了主体对世界的感知程度及其表达方式，充满了个性。建立自然语言处理系统的统计可能性显然是困难且无限的，因此，如果自然语言处理的研究取得重大进展，则显然需要在人工智能结构上取得重大突破。换句话说，句子语义信息的完整表达不仅取决于句子词汇的统计概率（仿生假设），而且还包括参考信息（物理符号的假设）和主题信息（上下文、背景、常识、主题思维）。因此，概率，参考和对象的三位一体代表了一种自然语言处理的人工智能框架。

5 自然语言处理的发展前景

自然语言处理技术为低成本，高效率的社会群体的工作和生活带来了许多便利。比如极其翻译技术，将文件输入翻译程序，将立即收到翻译文件，而且是免费的。如果对网页的要求不高，则可以通过Intemet搜索源语言文件。与手动翻译相比，机器翻译具有显着的优势，但是，无法完全理解比人工智能弱的人类语言，即在翻译过程中，说话者的语气，语调和肢体语言无法得到充分利用，这在一定程度上影响了翻译的真实效果。机器翻译非常适合复杂性低和重复性高的任务，但仍不能代替专业翻译，尤其是文学作品的翻译，通常需要更高的翻译要求。

6 结束语

在尖端技术的支持下网络平台都在不断扩展其功能并优化其体验。这与收集和分析用户数据以确保顺利实现个性化密不可分。在人工智能时代的背景下，自然语言处理技术的应用和开发仍然面临许多挑战。

参考文献

[1]刘鹏，人工智能辅助裁判理论思考与路径选择——以自然语言处理为例[J].法治论坛，2019 （01）：108-122.

[2]轩中，中国的自然语言处理领域的人工智能公司[J].互联网周刊，2018 （15）：62-64.

[3]李彦峰.人工智能在自然语言处理中的应用[J].襄阳职业技术学院学报，2018，17 （04）：71-74+78.

[4]蔡艳婧，程显毅，潘燕.面向自然语言处理的人工智能框架[J].微电子学与计算机，2011，28 （10）：173-17 6+180.

作者简介

孙伟博（1990-），男，吉林省长春市人。硕士学位。研究方向为自然语言处理。

张斌（1985-），男，河北省石家庄市人。大学本科学历。研究方向为通信方向。