APP下载

“一语千金”的时代已经到来

2017-09-26王哲

中国报道 2017年9期
关键词:声纹识别声纹身份

王哲

一声令下,让无数机器设备为你效犬马之劳已经走近现实。“一语千金”时代,你准备好了吗?

在古代,声音是最快速的传播途径。“一声令下”,千军万马纵横千里沙场。老子《道德经》里说,“大音希声、大象无形”,声音包含了最朴素的、深刻的辩证法。今天,我们已经在人工智能领域实现了人脸识别、指纹、虹膜、静脉等人工智能技术,但声音作为语义表达最基础的功能,其独特性是无法取代的。

经过无数科学家数十载的辛苦耕耘和默默钻研,借科技成果产业化的助力,语音识别技术正逐步成为计算机信息处理中的关键技术,语音技术的应用已经形成一个具有竞争性的新兴高技术产业,受到越来越多人的关注,声纹识别学科进步和产业发展高效融合、相互促进的时代已经到来。如今,一声令下,无数机器设备为你效犬马之劳已经走近现实。“一語千金”时代已经到来,你准备好了吗?

识破偷来的声音

声纹识别技术意味着一句话可以实现银行转账:比如说“给张三转1000元”,马上可以做语音识别、意图理解,得出指令,进行身份确认,最后进行银行转账。但是安全性如何保证?

近日,在清华大学举行的“清华前沿论坛——人工智能与信息安全”论坛上,清华大学控股的得意音通信息技术研究院宣布正式成立。在论坛现场,得意音通信息技术研究院院长郑方博士接受本刊记者采访时介绍说,声纹识别技术是基于每个人声道的长、短、粗、细以及每个人说话的节奏、口音、发音,还有声音所对应的喉管、声道、鼻腔的形状与尺寸等特征进行本质识别,因此就算其他人模仿得再像,出现在计算机上的声纹图谱也是千差万别的。但人的声音在表象上经常会出现变化,比如感冒发烧引起的鼻塞、嗓子变哑以及随着年龄增大等因素引起的声音的改变,这是否会影响到声纹识别?郑方对此解释说,人本身的声道构成、口音、节奏、发音还有很多身体特征都是不会改变的,因此这些表象的改变只是人耳会察觉到不同,但并不会影响计算机的识别。

对声纹识别最大的威胁是“窃取声音”,比如,在你说话的时候别人录下你的声音,然后用录音去登录你的银行账户。“为了防止这种情况,我们发明了一个名为‘声密保的产品,这是我们独有的专利产品。”郑方介绍说,“声密保”就是基于动态密码语音的身份确认系统及方法,其利用动态密码,结合语音识别和声纹识别技术,来实现用户身份的双重验证。简单来说,就是需要念出的数字每次都会改变,即使是用户自己,也要把动态码念对才可以通过身份认证。更重要的是,录音在播放时,它的声音频谱已经被破坏,与直接说的声音并不相同,完全可以被声纹识别系统检测出来。

在论坛现场,得意音通首席架构师肖永明针对声纹技术的安全性进行了演示,“主人”回家开门,利用声纹技术系统只需第一次使用时留下声音,日后通过说话方式就可把门打开,但是靠“主人”的录音却无法开锁,声纹识别技术真正实现了防“偷声音”的安全性功能。肖永明具体介绍说,在极为特殊的情况下,如遭遇犯罪分子胁迫发声开门,都无法逃过得意音通的识别系统,这是因为在其声纹技术中包含声音固定和特殊变化的识别特征,让其安全性达到了极高的层次。

声纹识别技术还具有一系列的优越特性,比如稳定性高。检测结果显示,在压力测试连续工作运行中,接收3300万次请求服务,声纹识别系统出现失败或故障次数为0次。声纹识别系统灵活多变,肖永明对此解释说,这是因为采用了自主创新分布式并发处理、分布式协同处理等技术,不同的场景有不同的解决方案,可以有效避免超大规模用户数导致的一些瓶颈陷阱,还有高并发运行时的一些冲突。声纹识别支持的用户数范围比较广,最少几个人都可以用,最多可以20亿人。

语音识别纳入人工智能

美国工程院院士庄炳湟介绍说,自上世纪50年代开始,经过数十年发展,语音识别技术出现了诸多新进展。但直到2007年,学术界才认为,语音识别是人工智能的一部分。“实际上,科学家最早开展语音识别研究工作时,几乎没有想过其是人工智能的一部分。”庄炳湟表示,“但1991年就已证明,机器对声音的识别一定比人分辨得精准。因为一般人要识别声音,需要转换,记忆会产生困难。在这个过程中,人很容易出错。对于一秒钟的声音,声纹技术识别错误率极低。而一秒钟的声音,对人耳而言时间太短,难以判别。”语音信号在各种感觉器官里交互性非常强,语音信号可以全方位无死角传播,正所谓隔墙有耳,声音的传播方向非常宽,接收能力很强。语言包含信息量非常丰富,口音的信息、语种的信息、内容的信息、情感的信息、性别的信息、声纹的信息……利用这些信息,可以有助于进行精准的身份认证。

目前,国家颁发了人工智能的发展规划,声纹识别技术是其中重要的一环。相对于其他生物识别技术,在安全性上,声纹识别名列前茅,如可以有效防止录音假冒。如果把人工智能和情感识别结合起来,可以检测这个人的声音是否是真实意图、是否被人胁迫,这一点,声纹识别相比其他人工智能技术已经遥遥领先。未来,声纹识别的重点应用将在安防领域,如刑侦破案、门禁、银行交易、智能家居等,这些特殊的场景对安全要求尤其高,得意音通的声纹识别技术解决了这些场景中对身份认证的安全需求。

据中国银联统计,有14.1%的直销用户在经营活动中会发生个人隐私数据泄密,甚至发生资金损失。使用智能手机或使用智能设备的人未必是合法的,人机的一致性或所谓信息安全的“最后一厘米”问题亟待解决,而采用人工智能的最新声纹识别技术,可有效为“钱袋子”保驾护航。中国建设银行的95533系统已率先应用声纹身份认证技术,在一段时间的试运营和测试后,成功地实现了客户的零投诉率。未来,中国银联将与得意音通合作,把声纹识别产品应用到更广泛的领域。

郑方表示,在移动互联网改变人们生活方式、信息安全受到挑战的当下,声纹识别的应用场景将非常广阔。endprint

猜你喜欢

声纹识别声纹身份
屏幕即指纹识别
声纹识别中的区分性训练
跟踪导练(三)(5)
基于i—vector声纹识别上课点名系统的设计与实现
面向移动终端的语音签到系统
他们的另一个身份,你知道吗
基于数字水印的人脸与声纹融合识别算法
声纹
声纹的妙用