APP下载

声纹密保技术和测试方法浅析

2015-04-15张宇华中国信息通信研究院技术与标准研究所工程师

信息通信技术与政策 2015年10期
关键词:声纹身份验证测试方法

张宇华 中国信息通信研究院技术与标准研究所工程师

刘乐 北京得意音通技术有限责任公司工程师

泰尔检测

声纹密保技术和测试方法浅析

张宇华 中国信息通信研究院技术与标准研究所工程师

刘乐 北京得意音通技术有限责任公司工程师

介绍了声纹和声纹识别的含义,概述了声纹密保系统及其声纹接口调用过程,并详细描述了相应的测试方法和测试工具的使用。

Avalanche Voiceprint Verification

1 引言

伴随着信息技术和网络技术的迅猛发展,人们对身份识别技术的需求越来越多,对其安全可靠性的要求也越来越严格。基于传统密码认证的身份识别技术在实际信息网络应用中已经暴露出许多不足之处,而基于生物特征辨别的身份识别技术近年来也日益成熟并在实际应用中展现出极大的优越性。其中,声纹识别技术便是近年来发展起来的一种新的更有效的身份识别技术之一。

1.1 声纹

所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。试验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。在实际生活中,每个人说话时的语声,都有自己的特点。很熟悉的人之间,可以只听声音而相互辨别出来,这就是语声人各不同的特性。

人的发声具有特定性和稳定性。从理论上讲,它同指纹一样具有身份识别(认定个人)的作用。虽然由于技术和经验的问题,暂时不能说完全达到了指纹那样的精确程度,但它已经被越来越多的国家认可为一种人身识别的科学方法。

1.2 声纹识别

声纹识别(VoiceprintRecognition,VPR),也称为说话人识别(SpeakerRecognition),有两类,即说话人辨认(SpeakerIdentification)和说话人确认(SpeakerVerification)。前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则是确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模。

2 声纹密保系统及其声纹接口调用

声纹密保系统是基于对说话人的语音识别或辨认的应用软件系统,它是根据人所说语音信息而表征出来的说话人的生理和行为特征来自动识别或辨认说话人身份的技术系统,是一款声纹身份验证服务。

本文定义了相关术语及其说明,具体参见表1。

表1术语和定义

声纹密保系统包括3个基础声纹接口,即声纹预留、身份认证和声纹信息管理接口。

2.1 声纹预留接口调用过程

本组接口用于进行声纹信息预留操作,过程包括8个HTTPWebservice交互过程,分别由8个TCP连接承载。

如图1所示,本接口第一个TCP连接用于获取一个声纹ID(GetVoiceprintId),此声纹ID具有一定的时效性,在有效时间内,本组其它接口可将此ID作为唯一标识进行相关操作;声纹信息预留成功后,此声纹ID将作为对应声纹信息的唯一标识,供其它组接口使用;在超过有效时间后,获取的声纹ID将作废。

图1 声纹信息预留:第一个TCP连接

如图2所示,本接口第二个TCP连接根据传入的声纹ID获取一组声纹预留文本(GetTrainingText)。调用者应根据此接口返回的建模文本进行录音。

图2 声纹信息预留:第二个TCP连接

如图3所示,本接口第三~七个TCP连接根据声纹预留文本录制完语音后上传(UpLoadTrainingVoice上传建模语音)。此步骤每次上传一条语音,需要被调用多次,直至所有的建模语音正确上传完成后,才能开始声纹信息预留。

如图4所示,本接口第八个TCP连接执行声纹信息预留操作(Train声纹信息预留)。

2.2 身份认证接口调用过程

本组接口用于进行身份认证操作,每个用户的身份认证过程包含4个HTTPWebservice交互过程,分别由4个TCP连接承载。

如图5所示,声纹身份认证接口第一个TCP连接用于获取一个身份验证ID(GetVerificationId),此ID具有一定的时效性,在有效时间内,本组其它步骤可将此ID作为唯一标识进行相关操作;在超过有效时间后,获取的身份验证ID将作废。

如图6所示,声纹身份认证接口第二个TCP连接根据传入的身份验证ID获取一个随机的身份验证文本(GetVerificationText)。调用者应根据此接口返回的身份验证文本进行录音。

如图7所示,声纹身份认证接口第三个TCP连接根据身份验证文本录制完语音后上传(UpLoadVerificationVoice上传身份验证语音)。语音正确上传完成后,才能进行身份验证。

如图8所示,声纹身份认证接口第四个TCP连接执行身份验证操作(Verify身份验证)。

2.3 声纹信息管理接口调用过程

图3 声纹信息预留:第三~七个TCP连接

如图9所示,本组接口用于对声纹信息进行管理,包含2个独立的HTTPWebservice交互过程,分别是查询声纹ID指定的声纹信息是否存在(IsVoiceprint Existed)和删除声纹ID指定的声纹信息(Remove-Voiceprint)操作。

图4 声纹信息预留:第八个TCP连接

3 测试方法

声纹密保系统的核心功能目标是通过用户声纹特征的唯一性来实现用户识别和鉴权,因此可以初步判定系统三大基础接口中,身份认证接口的调用过程是其核心,对于系统性能指标的确认应重点基于身份认证接口进行。

从系统实际应用角度看,声纹预留接口一次调用,按用户所购买的服务可实现长期有效;身份认证接口需频繁调用,且每次调用验证ID(VerificationId)随机产生;而声纹信息管理接口从逻辑功能上属于独立功能模块。身份认证接口无论从调用频度,还是从对服务器产生的负载压力上看,身份认证接口都是最大的,更容易产生性能瓶颈,因此对于系统性能指标的确认应重点基于身份认证接口进行。

从三大基础接口调用流程上看,声纹预留接口和身份认证接口的调用过程和模型都基本相同。

因此,本文对于声纹密保系统的系统性能指标的确认重点基于身份认证接口进行。测试方法主要为通过测试仪表有状态的完全仿真用户在身份认证中的4个进程,并最终判断认证状态进行。

3.1 测试工具的选择

Avalanche和LoadRunner测试工具分别是思博伦公司和惠普公司的产品,前者是一套测试仪器,后者是一套测试软件,都需要相应的License支持。

图5 声纹身份认证:第一个TCP连接

图6 声纹身份认证:第二个TCP连接

图7 声纹身份认证:第三个TCP连接

LoadRunner是需要被安装在高性能的服务器(俗称压力机)上进行性能能力测试,LoadRunner所处的压力机性能越好LoadRunner可运行的能力上限就越高,一般遇到性能压力不够也可以通过多台压力机组合环境解决。有缺点就有优点,LoadRunner作为客户端是可以通过各类主流程序编写脚本进行模拟客户端的行为模式,具有较好的灵活性和适应性,同时也对脚本程序编写要有一定的功底。

Avalanche是思博伦公司专门针对有状态的应用层性能测试所推出的旗舰产品,其普通C100型号的HTTP每秒新建连接数可达70W,并发连接数可到4000W。有优点就有缺点,Avalanche在灵活性和适应性上由于其是测试仪器,当前的应用版本所支持的功能不一定满足用户前沿技术的需求,需要与思博伦公司反馈需求但需要时间以支持。

例如,Avalanche目前不支持SSL国密SM2算法的运算,LoadRunner通过编辑脚本可实现,但是商密RSA方面的算法Avalanche处理的性能要好于LoadRunner(不包括3台以上高性能服务器叠加情形)。

基于以上分析进行判断,测试工具Avalanche和LoadRunner都能胜任对身份认证接口的系统性能指标的验证。由于研究院已购有一些Avalanche仪器,因此选择了Avalanche去完成。

3.2 测试思路

任何OSI应用层性能压力测试工具都无法在完全模拟功能的条件下进行既满足全进程又达到全特性的测试,只能尽力满足各方面的需求。这里使用的是思博伦公司的Avalanche应用层性能测试仪,为实现完整测试,需要了解和考虑测试仪使用方式和被测系统特性进行制定具体的测试方案。

图8 声纹身份认证:第四个TCP连接

首先,身份认证接口调用过程初始需要一个VoiceprintId。该ID是在声纹预留接口调用过程中得到,因此第一步需要通过一套服务器(安装有声纹密保系统+数据库)和客户端(手机APP或PC安装客户软件+麦克风)进行声纹建模。

其次,完成声纹建模的同一个人需要继续进行第二步身份认证接口操作,并且在此过程中使用交换机镜像功能或者客户端PC抓包,保存下完整的声纹建模的8个TCP交互数据包和声纹身份认证的4个TCP交互数据包的Pcap文件,后者的抓包文件将作用于Avalanche使用。

最后,将声纹身份认证的4个TCP交互过程的分析结果呈现为Avalanche测试仪可使用的方式进行传载和修改,操作Avalanche完成各项系统性能指标。

3.3 测试难点

难点1:声纹ID(VoiceprintId)具有一定的时效性,在有效时间内不一定完成全部测试。

难点2:系统性能压力测试时身份认证接口将被频繁调用,且每次调用获取的验证ID(VerificationId)随机产生每次不同,因此每次获取的认证文本内容同样不相一致。

难点3:Avalanche将在测试时上传的认证文本语音为Pcap文件里的语音,其语音内容是固定不变的。

3.4 预置条件

被测声纹密保系统需要做出调整以便于测试:

●将VoiceprintId的有效时长改为长期有效,测试完毕后删除。

●将文本内容和声纹语音同步认证的认证方式改为仅认证声纹语音,不关注文本内容。

3.5 Avalanche测试

测试仪表Avalanche即可模拟客户端,也可同步模拟客户端和服务器。由于被测声纹密保系统就是服务器,因此根据系统性能指标需求本次测试Avalanche仅模拟客户端即可。

因为配置难点主要集中在Actions界面的上半部分和下半部分,其它界面与普通HTTP测试方法没有不同,这里不再进行说明,值得注意的是在Loads界面使用的模型单位为SimUsers和SimUsers/second。

图9 声纹信息管理接口调用

Actions界面的上半部分就是执行行为的配置,根据2.2章节内容的分析,将相关指令写入其中。

Actions界面的下半部分是配合上半部分执行行为相关调用的配置,本次涉及有塑造变量(Forms)、搜索条件(SearchCriteria)和内容填充(HTTPContent)功能。以下对3个功能模块配置进行说明:

●Forms:塑造Voiceprintid变量,ID号被填写其中,且被身份认证过程的第一个TCP连接使用。

●SearchCriteria:搜索条件是Prefix:verificationid和Postfix:verificationid,配合Actions上半部分的相关指令将从服务器方每次随机反馈的Verificationid搜索出来并在第二~四个TCP连接中将Pcap文件中的Verificationid替换,使每一次的身份认证交互真实、合理;否则身份认证必失败。

●HTTPContent:将Pcap文件中第一~第四个TCP连接的HTTP内容拷贝并填入该处,配合Forms和SearchCriteria内容、Actions上半部分相关指令使身份认证交互过程尽量实现声纹密保系统满足全进程又达到全特性的测试思路。以第一个TCP连接内容为例,将的内容进行拷贝粘贴,并将“4bde890639c24ca38b0d8d2dd6514e2b”替换为“< Spi Variable>my_voiceprintid”。后续TCP连接同理处之。

如表2所示,Actions界面上半部分的执行行为配置:

#行是不执行的指令,一般被作者用为注释,在这里是为了读者方便理解。

综上所述,当声纹身份认证接口调用结束后,服务器反馈verify success和表示身份认证已成功且声纹匹配得分为84分(见图10)。

图10 声纹身份认证:成功和得分

表2 Actions:执行行为配置

4 结束语

声纹是指说话人语音频谱的信息图。由于每个人的发音器官不同,所发出来的声音及其音调各不相同,因此,声纹作为基本特征来实现人的身份识别具有实际的不可替代性和稳定性。

本文第3章节的测试方法可直接对系统性能指标包括:全部会话访问成功条件下的最大并发用户数、一定并发用户数下的单用户平均访问时间、最大并发用户数下的带宽、最大每秒新建用户数,负载上限(系统不能提供服务时的并发用户数),稳定性测试(一定并发用户数时长时间持续访问下服务器提供服务的成功率)等进行测试和取值。

此外,可根据该测试方法引申和扩展进行更加细节的需求测试,例如从系统实际应用角度出发,作为客户端的使用者来说,其是否在意获取声纹建模文本、获取声纹验证文本的平均耗时。

1 声纹.百度百科

2 声纹识别.百度百科

3 声密保WebService接口说明文档.得意音通

中兴通讯独家中标越南Vinaphone扩容项目

近日,中兴通讯和越南运营商Vinaphone签订了U900 Refarming&U2100扩容合同。中兴通讯为其提供GSM900和UMTS900频率重用解决方案,在保证现有GSM网络运营的前提下,重整频谱资源,实现高效重复利用。

中兴通讯的GSM900和UMTS900频率重用解决方案,包括了其先进的SDR分布式基站,架构统一的MicroTCA平台,以及全新分布式射频拉远模块,统一的硬件平台和网管。整个方案集成度高、安装快捷、网络维护简化。项目预计将于2016年完工,建成后将覆盖越南全国约1/3的面积,覆盖用户数将达2000万。

中兴首发端到端商用系统双连接测试

近日,在匈牙利首都布达佩斯举行的第14届GTI研讨会上,中兴通讯TDD产品副总韩钢在其主题发言时透露,中兴通讯率先开展了基于LTE端到端商用平台的双连接性能测试。基于Marvell的商用终端芯片和中兴通讯商用TDLTE系统,测试结果显示,在多种业务模式下,双连接均倍增了终端用户速率。与LTE载波聚合的测试结果对比,两者在速率性能方面并无差异。

韩钢表示,由于TDD和FDD双连接技术不要求理想传输,适配全球绝大多数现有传输条件,更适用于未来融合网络部署密集,宏微协同需求急剧增加的趋势。而且,其构建的灵活网络架构将更好兼容FDD和TDD技术发展节奏差异,并为建立更为健康的产业伙伴关系打下基础。

Introduction of Voiceprint Identification andTestMethod

This paper introduces the meaning of the voiceprint and voiceprint identification, an overview of speech security system based on Voiceprint and system working procedure, and describes in detail the corresponding testing methods and tools.

avalanche, voiceprint, verification

2015-09-10)

猜你喜欢

声纹身份验证测试方法
基于泊松对相关的伪随机数发生器的统计测试方法
基于云计算的软件自动化测试方法
DLD-100C型雷达测试方法和应用
屏幕即指纹识别
人脸识别身份验证系统在养老保险生存核查中的应用
对改良的三种最小抑菌浓度测试方法的探讨
基于数字水印的人脸与声纹融合识别算法
Endogenous neurotrophin-3 promotes neuronal sprouting from dorsal root ganglia
HID Global推动多层身份验证解决方案
声纹