APP下载

云中知声,芯中有道

2016-06-16马宏宾北京理工大学自动化学院教授

机器人产业 2016年3期
关键词:北京理工大学语音挑战

马宏宾北京理工大学自动化学院教授



云中知声,芯中有道

马宏宾
北京理工大学自动化学院教授

语音技术的背后,是一批有着梦想并追逐梦想的人。科大讯飞的创业故事,某种程度上已经成为了经典案例。而云知声,作为一个后起之秀,展现出更大的爆发力,这个才创业数年的公司,在不到两年的时间里,已从一个十几人的小团队,发展成了上百人的企业,收入上千万美元,私有云的开发者数量已经增加到了两千多家。而在这一迅猛发展的背后,我们看到了厚积薄发,看到了技术积累的重要性。

算法是语音技术的灵魂,构建于语音模型基础之上。从外在的语音数据中找寻内在的词汇联接,就是语音识别的本质,看似简单,实则不易,因为这一问题根本上可归结为海量的搜索。解决声音匹配问题,云知声从采用常用的高斯混合算法,到快速跟进微软提出的深度神经学习技术,完成代码实现后进一步基于内在原理,用最高效的方式实现同样的效果,再把计算瓶颈部分用汇编语言改写,充分利用计算单元的特性和处理能力,层层优化。这样的工程优化使得学术界象牙塔中算法真正得以落地,基于海量用户语音数据形成的语音云,来改进用户使用体验,提高识别准确率以及计算效率,发挥其价值。对技术后面的模型、算法、数据,持续不断的投入和积累,以及背后的研发人才,应该是云知声得以发展的关键基础。

另一方面,我们必须看到,技术本身从来不会自己直接“说话”并产生价值。云知声目前已取得的成就也反映了时代浪潮的巨大推动作用,趋势、时机、需求,加之远见、积累、团队,可谓缺一不可。云知声正在从事的AI 芯、AIUI、AI Service,我认为代表着未来的发展方向,将各种人们期待的“智能”加以实用化、人性化、终端化、网络化,必将是人工智能的发展趋势。

最后,作为结语,不妨简单提及云知声面临的挑战。案例中谈到了云知声面临的“人才匮乏”的挑战,这一挑战其实在很多高精尖领域都存在,高校忽视技术实现、企业缺乏核心研发,已得到很多有识之士的共识,今年5月份国家刚发布的《国家创新驱动发展战略纲要》其实已经注意到这些问题。此外,对语音识别技术来说,目前在公共场合或多人场合因隐私及噪声问题带来的识别难、体验差,造成现有的语音识别技术很少在这些场合大量使用;另外,目前通用语音识别产品在特定“专业”领域的不够“专业”,可能也是云知声面临的挑战,不过也可能催生出更多面向细分产业的创业公司。在与科大讯飞、BAT巨头乃至思必驰、灵声科技等的竞争中,云知声能取得多大的市场份额,鹿死谁手,仍须拭目以待。商业模式方面,如何通过语音技术实现商业利润的最大化,也仍然面临挑战。可以预见,技术的不断进步,必然会使语音技术就像互联网一样,成为人们生活与工作的基础设施,为大家带来更多的便捷与效率。

猜你喜欢

北京理工大学语音挑战
微信语音恐惧症
在新时代大力弘扬延安精神 坚定走好中国特色高等教育“红色育人路”
魔力语音
Magic Phonetics魔力语音
对方正在输入……
海滨城堡
第52Q 迈向新挑战