普通话水平测试系统中语音识别和语音评测技术研究

2020-02-22廖俐

科技创新导报 2020年30期

廖俐

摘要：目前我国的普通话测试系统具备语音识别功能和评测语音内容的基础技术，该系统与不同设备的适配条件进行研究，把智能理念融入对测试系统的设计和应用中，使人们可以独立使用测试系统，逐步完成对自身普通话水平的检测和提升。本文对普通话水平测试系统的用户使用进行了全面分析，通过阐述科研人员应当进行的计算机语言学技术研究，把合成技术的应用和语音数据库的应用做了简单剖析。本文根据语音识别在功能和技术方面的固有需求，对其与用户对接中要着重研究的评测技术，进行了功能考察、用户实验等方面的研究阐述。结合用户水平和智能理念，对可实现的技术条件进行了系统分析，提出了优化语音识别、控制评测技术的分析结论。

关键词：普通话水平测试系统语音识别语音评测技术

中图分类号：H102 文献标识码：A 文章编号：1674-098X（2020）10（c）-0084-04

Abstract： At present， our countr's Putonghua test system has the function of speech recognition and the basic technology of evaluating voice content. The system studies the adaptation conditions of different equipment， integrates the intelligent concept into the design and application of the test system， so that people can use the test system independently， and gradually complete the detection and improvement of their own Putonghua level. This paper makes a comprehensive analysis of the use of the Putonghua proficiency test system. By describing the computer linguistics technology research that researchers should carry out， it makes a simple analysis of the application of synthesis technology and voice database. According to the inherent requirements of speech recognition in terms of function and technology， this paper focuses on the evaluation technology in the connection with users， including functional investigation， user experiment， etc. Combined with the concept of user level and intelligence， the realizable technical conditions are analyzed systematically， and the analysis conclusion of optimizing speech recognition and control evaluation technology is put forward.

Key Words： Putonghua proficiency test; System; Speech recognition; Speech evaluation technology

普通话是建立我国各地区人们交流沟通的桥梁，也是多数学生在学习过程中首先要掌握的语言技能。特别是一些对语言能力要求较高的窗口职业，需要通过普通话测试确定候选人是否符合应试资格。这就需要测试系统具备语音识别功能和评测语音内容的基础技术，并对此系统与不同设备的适配条件进行研究，把智能理念融入对测试系统的设计和应用中，使人们可以独立使用测试系统，逐步完成对自身普通话水平的检测和提升。

1 普通话水平测试系统的技术需求

1.1 丰富用户体验

用户与平台所看到的系统页面存在差异，工作人员应将为用户提供便捷服务为技术重点，通过体验语音智能带来的丰富体验。对系统在语音識别方面的模糊技术进行提升，使测试系统具有区分音节和声调的准确技术，对用户在词语、长句中的普通话朗读进行评测，通过在评测结果中标注不当发音和弱读音节，帮助用户了解他们的普通话水平具有怎样的提升空间[1]。结合系统内置的评测技术对用户反馈进行分析，使用户能真实感受到语音功能的提升变化，存在自身成长和智能交互的良好体验。

1.2 提升用户水平

依据用户反馈将系统的语音识别进行精准度提升，结合常用设备对系统的收音效果、评测技术进行细致研究，在安静环境中完成测试系统的多次技术体验，不断增加系统内的词组数量和发音组合，使测试系统具有识别中文发音和读音错误的真实能力。在用户页面设置记录用户使用情况的系统功能，记录下用户练习普通话过程中的错误内容，帮助用户完成学习普通话、矫正发音问题、记住复杂词语的一系列使用过程。通过识别功能将用户的普通话进步水平进行量化，应用评测技术实现用户矫正过程中的发音标记，帮助用户了解自身真正的成长诉求和水平缺陷，真正实现测试系统与相关技术的紧密结合。

2 普通话水平测试系统技术的应用研究

2.1 语音合成技术的应用

普通话水平测试系统的用户使用是以网络技术为架构，对输入语音进行上传后的技术分析，再将分析结果快速呈现给客户的具体过程。实现输入语音的精准上传，就要在系统内实现计算机语言的语音合成，将用户语音变成能够被网络技术所识别的音频片段，并在有用户需求的情况下进行音频保存。语音合成技术是在网络平台的搭建基础上进行的多学科知识运用，将声音信号的处理和转换过程做了必要的技术控制，依据发音规律将用户语音转变为机器可读的音韵序列，再把音韵序列合成为用户能够听到的机器声音，实现测试系统在长期使用下的语音识别基础。提升合成技术对用户声音的还原程度，依据普通话测试内容进行练习材料的机器录入，使系统能根据用户语音与录入声音的对比，进行智能环境下的用户普通话准确评测。

2.2 语音识别技术的应用

语音识别是测试系统中最为关键的技术功能，也是处理用户语音时较为重要的核心技术。机器对系统内容的识别存在可读信号、模糊语音等标准，需要通过人工的技术应用进行机器系统的必要矫正，使用户的声音处理不因机器的识别标准出现不可逆失误。语音识别技术是通过网络算法、信息处理等方面的技术工作，在系统后台进行对识别效果的积极矫正，丰富系统中可用字词的数量以及对应词组的用法，实现整篇文字材料的用户语音识别。针对机器将可读信号转变为用户指令的识别过程，强化系统识别功能的转化速度和信号强度，保证测试系统能够依照网络平台的运作模式，实现提升用户体验的智能化语音识别，结合用户使用数据优化识别技术的功能效果[2]。

2.3 语音评测技术的应用

实现完全以用户体验为主的智能系统，就要尽可能减少人工进行系统维护的作业次数，形成主要以机器服务为主的系统运作模式。普通话测试中对用户发音的细致评测，是测试系统中最常使用的技术功能。合成技术和识别技术都是通过系统数据库，进行用户需求方面的语音处理。而评测技术是直接根据用户表现进行发音评价，借助其他技术实现固定模式的用户服务。语音评测技术是用户语言学习过程中，做好自我评价、分析自我水平的重要工具，也是网络技术发展过程中的一项重要领域。要采集符合普通话等级要求的测试材料，通过人工干预调整评测技术在应用过程中的具体表现，实现与现场考试标准一致的评测功能。让机器学习评分标准和语音材料，为用户表现打出比较专业的评测分数。

3 语音识别与语音评测技术

3.1 识别功能与评测技术

语音识别是网络平台与系统用户建立互动关系的基本功能，是获取评测内容的前提条件和服务基础。工作人员要根据识别过程对此系统功能，进行语音识别和评测技术的必要衔接，使机器能够准确分析用户来源的语音信息，并对信息中的错误内容进行数据对比，完成识别语音信息和识别信息内容的测试步骤，减少识别过程所受到的环境杂音影响。结合网络技术对用户储备使用数据、应用语音素材等操作，进行及时的交互端反馈和系统反应，使评测技术能基于系统指令完成对规定语音的检查，将识别功能用于对规定语音的检查过程中。

3.2 识别技术与评测效果

识别技术是确保系统机器准确接收用户语音的必要内容，是决定评测效果的一项智能成果。工作人员应结合等级标准对评测效果进行严格要求，通过识别技术将语音处理过程做细致研究，把测试系统进行不定期的漏洞修复。建立用户页面中的操作提示，使用户的系统使用能够被识别技术所记录，并根据具体记录为用户推荐与之相匹配的语音素材，使用户登录系统便能享受到为他们定制的训练计划，通过更改计划安排或者替换现有计划进行普通话训练。结合识别技术对用户语音的处理效果，进行了解用户真实水平的测试要求，并将系统的识别功能做数据分析、语音处理等方面提升，使评测效果能够满足用户在自我矫正、水平检测等方面的需求。

4 评测技术的应用过程研究

4.1 语音数据库的建立

普通话水平测试系统的运作需要使用大量的语音素材给予支持，进行标准发音内容和非标准发音内容的分别录入。使机器能够识别用户语音中的不标准部分，应用与用户发音相近的素材进行评测打分，建立与用户数据相关的语音训练模型[3]。结合识别技术对系统的发音模式进行控制，依据音节和声调的不同建立标准数据库，形成以机器或人工为标准的可评测数据。依据机器标准进行用户日常训练的准确评测，以标记用户错误和陪同用户诵读为主，帮助用户养成自主学习和定期练习的使用习惯，适应测试系统的普通话训练标准。结合用户水平的提升过程，建立专属于某用户的评测数据库，将系统中的语音素材进行满足用户的随机组合，实现有助于普通话学习的系统环境。依据人工标准进行用户训练数据的分析标记，为水平较高的用户提供准确矫正的专业服务，满足用户在学业和职场等方面的较高需求，引导用户学习正确的发音知识、模仿精准的语音素材。

4.2 用户角度的功能考察

测试系统通过对用户数据的在线分析，能够了解用户距离目标水平有多远，提供最接近用户真实水平的评测数据库。基础水平不同的用户学习普通话，有学习难度和投入时间等方面的需求差异。出于职业需求和基于自身爱好所进行的学习，有对评测功能的不同准确度需求，需要工作人员切实考虑到用户角度的使用效果。在语音素材的設计过程中做好用户调研，依据多数用户的语音识别情况进行音频检查，对用户阅读困难的素材内容进行评测控制。通过分析句意和语音环境，呈现出纯净度较高的用户声音，使用户能够对照标准素材找到合适的学习方法。根据语音识别中发现的错误音情况，对错误引所对应的文本内容进行研究，使普通话以外的其他语音也能够被识别，增强用户对不同语音习惯的了解程度，使测试系统能结合不同的语音现象出具评测结论。

4.3 技术应用的用户实验

实验数据是最能够说明技术效果的测试内容，进行使用测试系统的用户实验，对数据库的应用效果和评测技术的应用方面进行分析，能够使工作人员了解到与用户体验最为接近的使用数据。把建立语音模型作为实验的根本目的，把参与实验的用户数量作为分析样本，选择安静的实验环境和较高的语音设备，请取得一级资格证的50名用户进行同一文本的语音录制。其中18到35岁的用户30名，35岁以上的用户20名，男、女用户分别为25名。要求他们录制40篇左右的标准语音素材，并通过现场打分进行数据分析，得出与真实情况接近的数据分析表1。

通过表格数据能够发现用户水平与性别无直接关系，没有进行长期练习的多数用户有水平上的下降，处在中等水平的用户比例较多，且用户大都存在无法预知的进步需求，现场打分无法和系统评测一样涉及到用户体验。工作人员应通过完善系统的数据算法，实现发音质量、语音模型等方面的技术要求，使评测技术能够模拟现场打分的真实环境，为用户的普通话学习提供稳定的系统支持。

5 测试系统的研究结论分析

5.1 优化语音识别的技术效果

根据用户使用语音素材的真实情况，分析用户水平与系统功能的直接关系，對测试系统的语音识别进行长期维护，避免出现用户数据的无记录现象。使系统能在识别过程中了解用户喜好，在用户页面中呈现出适宜用户水平的推荐内容。将系统接收用户语音的过程进行优化，结合网络技术实现语音内容的在线翻译，增加系统反应时所能应用的数据库词条，方便用户搜索测试系统中的普通话练习素材。针对识别技术的不稳定状况，进行系统网络和技术效果的优化，使系统机器能依照语音的处理过程，完成对用户操作的实时反应和评测标记，让用户能够通过线上形式实现，对普通话的日常训练和成果检查。

5.2 语音评测技术的准确控制

测试系统的用户群体存在不确定性，要精准控制评测技术对不同用户的反应效果，确保系统评测模式适合大多数用户，并运用识别技术进行评测过程的准确记录。将普通话的等级要求与评测技术相结合，依据测试等级对用户水平进行系统确定，通过用户的错误音种类，分析用户需要使用数据库的哪些具体素材，实现评测技术在测试标准、素材使用方面的准确控制。结合不同目标等级的用户数量，通过评测技术进行用户数据和系统数据的分别检查，将系统数据作为与用户数据形成对比的可用材料，确保技术控制不存在数据方面的安全隐患、系统运作不存在垃圾数据的缓冲干扰，能够持续对评测过程做出准确判断。

6 结语

对普通话水平测试系统所进行的技术研究，应从用户对功能和技术的需求收入，丰富用户使用过程带给他们的提升体验。根据使用过程需要的语音识别和评测技术，展开对技术应用的合成、识别等技术的研究了解，把系统的识别过程作为研究评测技术的重要内容。通过数据库、用户角度等方面的细致研究，对语言素材的应用需求进行深入了解，结合以上研究进行用户实验和结论分析。

参考文献

[1] 胡永，张旭东，赵静，等.智能终端语音识别用户体验测评研究[J].电视技术，2019，43（1）：65-70.

[2] 杨鸿武，周刚.基于改进混合CTC/attention架构的端到端普通话语音识别[J].西北师范大学学报：自然科学版，2019，55（3）：52-57.

[3] 王晨霞.普通话水平测试计算机辅助系统设置要点探讨[J].现代信息科技，2019，3（3）：91-92，94.

[4] 陶勇.建构主义理论视野下学前教育专业教学目标的设定[J].课程教育研究，2017（12）：6-7.

[5] 李新义，刘邦奇.基于建构主义的智慧课堂教学模式研究[J].中国教育信息化，2018（6）：44-48.

[6] 余芳.大学生演讲能力的培养探析[J].教育观察（上半月），2017，6（15）：20-21.