自然语言处理技术在调度指挥中的应用

2023-11-06李晴艳翁少轩

交通科技与管理 2023年20期

李晴艳,翁少轩

（1.上海申通地铁集团有限公司,上海 201103; 2.上海工程技术大学城市轨道交通学院,上海 201103）

0 引言

城市轨道交通控制中心作为轨道交通系统的“神经中枢”，是对轨道交通全线所有运行的车辆、车站、区间进行总的监视、控制、协调、指挥、调度以及相关运营数据指标采集分析的中心。在线路运营过程中，对于调度员应急处置和事件复盘是一项极其耗时、耗力的任务，因此无法适应超大网络的运营和管理现状。在城市轨道交通领域，深度学习技术可以与语音识别和知识图谱相结合，为调度指挥提供支持，实现运营方式的升级和优化。在语音识别和知识图谱等领域中，自然语言处理技术扮演着十分重要的角色。通过对语言文本的分析处理，自然语言处理技术可以理解字词的形、音、义，从而支持和优化语音识别和知识图谱等技术的应用，为城市轨道交通提供更高效、更安全、更智能的服务。

1 自然语言处理技术

自然语言处理技术（Natural Language Progressing,NLP）是人工智能领域和计算机科学领域的一个重要研究方向，旨在研究人与计算机交互的语言问题。通过利用计算机识别理解字、词含义，在人机之间建立桥梁实现无障碍交流[1]，因此自然语言技术的研究具有重要意义。

自然语言处理技术的兴起和发展大致可分为四个阶段。1950 年图灵在发表的《计算的机器与智能》一文中提出了图灵测试[2]，被视为自然语言处理技术的开端。20 世纪50 年代至70 年代人们一直使用基于规则及专家分析的方法来探索语言处理，后该方法被认为具有一定主观误导性。70 年代以后科学家们提出了基于统计的方法来解决问题，识别准确率得到了质的飞跃。2006 年以来随着深度学习算法的加持，NLP 技术迎来了其飞速发展的阶段。近年来，BERT 等预训练模型的面世降低了深度学习模型对大规模标注语料的依赖程度，其正逐步成为自然语言处理的核心技术[3]。

近年来，将自然语言处理中的分词、文本规范化等方法与深度学习方法相结合能够实现文本中指定实体及实体关系的抽取，以此为基础构建知识图谱。语音交互中的NLP 技术主要对语音识别出的文本进行文本预处理、语义识别等工作，为语音合成提供依据。

2 自然语言处理技术在调度指挥中的应用

将机器学习、深度学习等人工智能方法和技术引入到地铁调度的日常生产工作中，能够实现调度处置效率的有效提升。利用语音识别、基于知识图谱的信息检索方法等技术来丰富调度交互手段，提升系统的辅助决策功能。

2.1 语音识别实时转译

20 世纪50 年代，贝尔实验室实现了单个词语以及小词汇量语音识别，标志着语音识别的兴起[4]。经过几十年的发展，语音识别实现了由早期基于规则的识别方法至神经网络识别方法的飞跃。

日常运营中，调度员通过对讲机、公务电话、热线电话等媒介与不同岗位员工进行交互，获取、通报事件的实时信息。针对重要信息，调度员需人工记录后并与交互对象进行确认。在应急事件处置过程中由于重要信息较多调度员需进行多次记录、核对，重复的机械工作无疑加重了调度员的工作负荷，调度交互方式亟待升级。

针对当前调度交互任务低技能工作量大的问题，引入语音识别技术完成语音信息的实时转译，有效缓解工作压力实现交互方式的智能升级。与此同时，交互信息的无纸化消除了传统纸质文档的限制和局限性，提供了更多的信息管理功能，利于实现交互信息的精细化管理。

2.2 知识图谱检索辅助决策

目前，在突发状况下调度员需以应急预案中的解决方法为依据，但存储于调度规程等文本中的调度决策信息与实际突发问题存在检索匹配效率低的问题，调度员无法在第一时间获取所需信息，有违应急事件处置的时效性要求。

在日常运营工作中调度员除了需要监督列车运行、必要时调整运行方式还需按规定在不同平台完成文本信息的填记。以调度日志为例，记录的文本信息内容包含列车故障现象、调度员处置方法、故障处置影响等信息。考虑实际突发状况与应急预案中的场景存在差异，调度日志可视为调度员的工作经验积累，因此日志中记录的故障处置方法、故障处置影响对调度员具有重要参考意义，有必要对其进行分析。由于线路调度日志内容均为非结构化数据，因此需利用自然语言处理技术进行加工处理，利用NLP 技术中的分词、文本规范化技术去除噪声及冗余信息，统一文本格式。

针对上述两个问题，可利用命名实体识别技术对调度规程以及调度日志中的重要信息进行提取，将提取出的数据以三元组的形式存入Neo4j 图数据库中，有效提升数据的存储和检索效率。

2.3 智能客服问答系统

为了进一步改善乘客的出行体验，可依据实际情况划分不同出行场景，构建基于知识图谱的智能语音问答系统，实现语音问路、语音辅助购票、语音答疑等功能，提升乘客出乘体验。

构建该问答系统主要包括以下几个步骤：

（1）知识图谱构建。为确保问答系统的适用性，首先按场景梳理乘客实际需求，分别构建适用于不同场景的知识图谱。

（2）语义识别。当用户查询问题时，系统首先对语句进行解析，理解语句中的实体及实体关系，确定用户的查询意图。

（3）图谱查询。将用户的查询语言转换为图谱的查询语言，在知识图谱搜索引擎中进行检索。

（4）结果生成。在检索出问句相关的结果后转换为自然语言，并对结果按照相关性及可信度进行排序。

NLP 技术与知识图谱技术的融合可以实现更高级的信息提取和语义理解。在构建知识图谱阶段，NLP 技术可以用于从文本中提取人物、地点、时间等具体实体及实体间的相互关系。在语义识别阶段，利用NLP 能够更好地进行问询语句文本分词、实体识别及意图识别，提升文本效率。

3 NLP 对调度生产语音输入技术的优化

综合考虑地铁运营线网的复杂性、恢复正常运营的迫切性以及调度员在日常信息传递确认等业务中的工作负荷高，为有效推进调度指挥的智慧化进程，针对调度工作引入语音识别技术，实现交互信息的实时转译。

3.1 系统框架

目前，通用领域语音识别主要包括以下几个流程：

（1）音频信号预处理。对收集的声音信号进行分帧、噪音去除以及声音特征提取，将语音信号转化为数字信号。

（2）声学模型训练。在完成预处理后，利用语音数据训练声学模型达到可以区分不同语音音素的目的。

（3）语言模型训练。实现根据上下文信息准确预测下一个可能的词语。

（4）声学特征匹配。将采集到的用户语音转为数字信号并将该信号与声学模型中的音素进行匹配，得出最有可能的音素。

（5）语音转文本。在得出音素序列之后，利用语言模型根据上下文的信息预测一个最有可能的词语并将词语序列转换为文本形式，实现语音识别[5]。语音识别系统结构如图1 所示。

图1 系统结构框图

实际应用中，语音识别技术的落地不仅受到算法本身的影响，应用场景中噪音的干扰、多人环境下语音识别、方言和口音差异等问题也会对语音识别的准确率造成影响。为有效提升语音识别系统的场景适用性，针对环境噪音，在声源采集处的耳机中应用主动降噪技术，通过不同相位的音频信号来降低或消除噪音的影响，同时在音频文件预处理时加入降噪算法，提升音频质量。针对多人工作环境，在语音识别系统中加入声纹识别模块，明确说话人身份。

3.2 调度专业用语特征分析

调度员交互内容主要包括发布调度命令、确认设施设备状态以及确认人员身份信息。语音交互内容示例如表1 所示。根据对表1 内容以及交互录音文件的分析，调度交互主要具有如下几个特点：

表1 调度员交互内容示例

（1）涉及较多调度岗位生产管理的专有名词。

（2）涉及部分数字如列车车次号存在特殊发音现象，例如251 次列车发音为liang（两）wu（五）yao（幺）次列车。

（3）交互过程中噪音较多。

（4）涉及系统名称多以英文缩写单词的形式出现。

（5）主要涉及场景包括发布调度命令、确认设施设备状况以及确认人员身份信息。

依据交互内容特点将地铁调度语音识别定义为特定领域非特定说话人的小词汇量语音识别。当前语音识别的研究多针对日常用语识别，然而调度员在日常交互过程中存在涉及较多专有名词、命令号和系统名称存在特殊发音、交互语音质量较差等问题，若直接将日常用语语音识别引擎应用至地铁调度岗位识别准确率必然不高，不足以达到使用标准。

3.3 调度交互术语库构建

充分考虑调度语音识别系统搭建难度，决定采用制定地铁调度岗位交互专有名词术语库在语音识别中优先输出术语库中字词的方法提升识别准确率。为了确保术语库建设的全面性，充分参考《轨道交通运营调度规程》《轨道交通电力调度规程》等文件，收录其中地铁专有名词。由于不同文件中的信息量差异较大，人工提取需要耗费大量时间，因此利用自然语言处理技术在确保准确率的基础上提升效率显得尤为重要。

调度专业相关文件通常采用长文本形式存储，因此需要使用文本分词方法将其转换为字或词的形式。当前中文分词包括基于规则的分词方法、基于统计的分词方法、基于机器学习的分词方法以及混合分词四种常用方法，但是这些方法大多面向通用领域，用于调度专业术语分词时往往存在如下问题：①文本中专有名词较多；②垂直领域名词缩写多；③存在较多的歧义性，相同的字词在不同语境下的表达含义不同。基于上述问题，对于垂直领域的文本分词需要采用一些特定的技术和方法以提高分词效果的准确性和完整性。

该文采用基于规则的分词方法来构建术语库。首先构建调度术语词典。主要包含以下三个来源：一是利用中科NLPIR 工具对地铁调度领域相关文本专业名词进行抽取，完成抽取后采用人工筛选的方式保证词典的准确性。二是收集互联网中地铁既有专有名词归纳的相关信息。三是调研汇总调度领域近年来新出现的设备名称词、操作动作词等，为确保词典制作的全面性，将这些新词人工添加进词典当中。完成调度术语词典的构建后即可对调度领域文本进行分词。结合实际情况，发现相关文本中存在很多与设施设备、操作无关的词汇，例如“的”“下列”“之一”等等，这些词汇对于术语库的建设没有任何作用。因此为了提高调度专业相关文本的分词准确率，在分词过程中首先利用哈工大停用词表去除无关词汇对文本内容进行筛选。结果显示该方法有效提升了分词工具对于调度专业相关文本中特定专有名词的识别和分词准确性。

将分词得到的字词按照通号、供电、车辆、公务等模块进行划分。最终术语库中收集了1 860 个地铁专有名词，约250 个地铁设施设备操作词以及约350 个设施设备状态名词。针对地铁调度中具有特殊发音的字词人工标注发音规则。

在语音识别系统中加载构建好的专业术语库。在语音识别的过程中，当系统进行词语匹配时将首先在术语库中进行词语匹配，将术语库中的字词设置为最优先级，这样在多个候选结果中词典中的字词将更有可能被选择为最终的输出结果。

4 结语

人工智能技术的不断发展为地铁调度智慧化升级带来了无限可能，结合自然语言处理技术的人工智能方法在调度智慧化升级中具有广泛的应用场景。该文以地铁调度语音识别为例，分析了当前语音识别引擎存在的不足，针对地铁调度领域存在大量专有术语的情况，充分利用NLP 技术制定了地铁调度专业术语库，但在此基础上距地铁调度语音识别的落地应用还有诸多问题，如多说话人环境音频采集质量低，调度语音识别功能的应用还需在实际场景中不断完善。