APP下载

刘庆峰:峭壁上的听风者

2014-11-27吴嘉雯

东西南北 2014年17期
关键词:语音

吴嘉雯

不辞山万重,花开幽谷中。说的既是一个科学家笃信核心技术创新才能改变世界,进而为语音技术搏上一切的执着;更是一个企业家在不停地试错与试对中,自己为自己制造出一个产业风口的理性。

对于41岁的刘庆峰而言,2014年6月9日是值得纪念的一天——公司成立15周年。

这家脱胎于中科大的企业,在语音技术的峭壁上不懈攀登,从一个18人的小公司,进化成了国内语音产业的龙头老大,甚至领先全球。

这是一段极具科幻色彩的创业历程。

所谓科幻,便是以基于科技的想象力,打破人类认知的局限。在人类文明史上,语音是最自然最直接的交互方式,但仅限于人类与人类。而刘庆峰所做的,是让人类与机器之间实现语音交互,如同科幻电影里的情景。

然而,想象与现实之间的落差,不仅是一道“把科幻变成科技”的峭壁,还有一条“把科技变成产业”的鸿沟。所幸的是,站得越高,看得越远,风也越大。技术峭壁上的刘庆峰,用执着与理性把鸿沟变成了风口。2013年,科大讯飞占据了国内70%以上的市场份额,拥有4亿多用户,年收入达到12.5亿元,自2011年以来的复合增长率高达40%。

选择

究竟有没有骨骼精奇、百年难遇、能使如来神掌的练武奇才!不管有没有,不可否认的是,世上确实存在着天赋异禀的人。

1992年,19岁的刘庆峰凭借出色的数理计算能力,被中科大从事语音技术研究的王仁华教授相中。时至今日,他仍然忘不了22年前,第一次走进语音实验室所感受到的震惊——站成一排的计算机已经可以初步合成简单的人声。

“以前我学数学是为了考第一,但不知道它到底怎么用。进了这个实验室后,才发现数学可以用于数字信号处理。这对我是一个很大的触动。”由此,刘庆峰决定跟着王仁华教授留在语音实验室。

从后来的历史看,这是一个改变了中国语音产业的决定。实际上,当时的中国语音产业一片混沌。虽然早有科研机构从事语音技术研究,但都是单兵作战小打小闹,迟迟未见成果,产业化更是遥不可及。而另一边,IBM、微软和摩托罗拉等国际巨头早已大兵压境,纷纷在中国成立语音研究机构,觊觎着中国未来的语音市场。

在这样的时局下,王仁华教授的这个语音实验室,就如同一颗生机勃勃的种子。而刘庆峰进入实验室后很快如鱼得水。

一次,王仁华认为实验室里一个产自日本的语音分析工具效率太低,问刘庆峰能否用两个月时间试着提高一倍。谁知刘庆峰竟然仅花了一个月时间,将效率提高了整整10倍。他甚至还向王仁华建议,可以将其用于优化语音合成系统。

开明的王仁华打破惯例,让年轻的刘庆峰牵头做一个语音合成系统。结果,刘庆峰不负众望,在当年的国家863计划成果比赛中,他开发的语音合成系统,不但保证了音质,还具备了优良的语音自然度,合成出来的语句近乎人声。这成了当年比赛中最为轰动的科研成果。

然而,对于当时的刘庆峰来说,最大的成就感并非技术成果本身,而是将技术成果转化为实际应用。1996年暑假,刘庆峰帮助华为优化114电话咨询平台的语音,通过语音合成技术,他使得计算机报电话号码的语音,近乎于真人语音,这让华为在原有4万元研发经费的基础上追加了1万元的奖励,还请他飞赴深圳参加研讨。

这次跟华为的合作,为刘庆峰打开了一扇广阔的门——他不但获得了王仁华教授更大的支持,让他可以调配实验室的全部资源,还看到了语音产业的市场前景。更为重要的是,他开始意识到,只有产业化才能真正推动语音技术的自主创新。

于是,刘庆峰鼓起勇气向王仁华教授提议,自己一边攻读博士,一边办公司创业,其中最核心的诉求是,设立股权机制。这其实是一个打破常规的想法。在国内科研界,老师与学生的关系,不但类似于老板跟员工,还更具有权威。哪有学生敢于向老师提出这样的要求。

但王仁华教授则不一样,他立即爽快地答应了刘庆峰:“你不但该拿股份,而且还应该拿得比我还多。”

最亮的火把

老师无私的支持,彻底点燃了刘庆峰心中的火把。激动万分的他登高一呼,不但实验室里的师兄师弟们纷纷响应,而且中科大BBS八个版主中的六个都加盟过来,最终组成了18人的创业团队。

这些人里,有当年中科大电子工程系的第一名胡郁;计算机系第一名、获得中科院自动化所保研机会的胡国平;以及中科大BBS黑客版版主,网络ID名为“绝地战警”的陈涛。这一帮学霸们有着一股浓浓的技术报国的情怀。

1999年,26岁的刘庆峰正式创立科大讯飞。

命运很快眷顾了这群满腔热情的年轻人。科大讯飞成立当年,合肥市领导带着三家投资机构前来考察。听完刘庆峰介绍产业前景与团队实力后,市领导当场表态:“这些小伙子必须留在合肥。”随后,三家投资机构以“3060万元占股51%”的条件投资科大讯飞,而刘庆峰的团队仍然是最大的单个股东,这也是科大讯飞后来进行几轮融资的原则。

沉甸甸的3000多万元现金揣在手里,刘庆峰在团队内部发话:燃烧最亮的火把,要么率先燎原,要么率先熄灭。说到底,这是一种破釜沉舟勇往直前的坚决,只是这把火首先应该烧向哪里!

其实,当时国内语音技术的发展瓶颈在于机制。语音技术是一个典型的综合学科,涉及数字信号处理、声学研究和实验语音学等诸多领域。而诸如中科大、清华、中科院和社科院等科研院校只是擅长于某一领域,互相之间不但从来没有合作,甚至为了一些国家项目和经费,争得头破血流。更为严峻的是,这些院校的大量人才被IBM和微软等国际巨头挖走,民族语音产业岌岌可危。

不把各种力量拧成一股绳,就无法与国际巨头们抗衡。刘庆峰逐个拜访了这些科研院校,向他们表达了三层意思:第一,中文语音产业已经被外国人掐住了喉咙,必须联合起来;第二,科大讯飞向他们提供项目经费,比国家划拨的经费还要多;第三,各个机构专注于自己擅长的研究领域,科大讯飞负责产业化整合,同时给各个机构股权,实现成果共享。endprint

“这些老师们都有很强的民族情结。”在刘庆峰的轮番劝说下,中科院声学所、社科院语言所和清华大学等科研院校,最终跟科大讯飞结成了紧密的合作关系,科大讯飞也由此完成了对于产业核心源头技术的资源整合。

刘庆峰得以一跃而起,攀上了语音技术的峭壁。至2000年底,刘庆峰拓展了包括华为、中兴和联想在内的50多个合作伙伴,这其中跟联想集团的合作,还为后来的第二轮融资埋下了伏笔。

华山一条路

然而,从大众消费市场,到企业客户市场,再到技术授权市场,在一次次的商业模式调整中,刘庆峰从最初的乐观主义里彻底清醒过来——残酷的现实是,在核心源头技术的整合上投入了重金,却迟迟未能在市场上真正打开局面,这让科大讯飞的资金链几近断裂,最困难时公司账上只剩20万元。最亮的火把还未燎原,就要熄灭了。

整个2001年,刘庆峰都在一种莫大的痛苦中煎熬,团队军心动摇。有人质疑,语音产业到底能不能做大;有人提议,语音业务赚不了钱,不如改做网络游戏;还有人甚至说,做房地产来钱快。“我们当时就像迷失在大海里,我作为船长,必须要指明一个方向。”

面对种种杂音,刘庆峰专门将团队拉到合肥巢湖边上开会,大家七嘴八舌地议论了一通后,他最终掷地有声地说了一句话:“如果不看好语音,请走人!”众人立即鸦雀无声。

这次巢湖会议在科大讯飞创业史上的意义,如同红军长征时的遵义会议。从那一天起,科大讯飞明确了“语音是唯一方向”的战略,此后无人再有任何异议。

自古华山一条路。但这条路要继续走,还需要战略投资者的支持。在一次全国青年大会上,刘庆峰找到了复星集团董事长郭广昌。郭广昌当即对科大讯飞表现出了浓厚的兴趣。

尔后,通过一些业界内的合作关系,刘庆峰还找来了联想投资和英特尔。自2000年12月到2002年3月,三家知名企业相继入股科大讯飞,为这一国内语音产业最亮的火把,注入了资本实力和产业资源。

投资方在资金、资源和经验上的助推,将科大讯飞推向了产业化的快车道。而刘庆峰的团队也没有辜负股东们的期望,科大讯飞终于在2004年扭亏为盈,并从2005年至2007年保持了净利润130%的复合增长。2007年,科大讯飞营收达到2亿元,净利润达到5300多万元。次年科大讯飞成功登陆深交所,成为中国第一个由在校大学生创业的上市公司,也是中国语音产业唯一的上市公司。

听风者

事实印证了刘庆峰当初在巢湖会议上的判断,科大讯飞站在了业界同行难以企及的高度上。而衡量这一高度的,不仅仅是上市公司骄人的业绩数据,还有高不可攀的技术峭壁。

在与产业化平行的另一条历史轴线上,科大讯飞逐步形成了以语音合成和语音识别为核心的技术体系。这一系列的技术突破,不但在国内屡获大奖并牵头制定中文语音技术标准,还连续8年在全球英文语音合成大赛中夺得第一,连续5年在美国国家标准技术研究院主办的语音识别大赛中夺得多项第一。

语音技术的应用范围很广。

2008年刘庆峰瞄准了无线音乐市场。科大讯飞跟移动、电信和联通达成合作,通过拨打电话,用户可以通过说出歌手名、歌曲名甚至哼唱等方式,从数万首的歌曲库中快速搜索到歌曲,而用户通过这样的方式定制彩铃,科大讯飞就会有收入分成。全国50多家省级电信运营商,先后成为科大讯飞的合作伙伴,仅2010年一年,这项业务就贡献了7000万元的收入。

又如,刘庆峰发现由于驾车时司机手握方向盘,双眼紧盯前方,在这种情况下语音交互就成了刚需。但一个问题是,汽车在行驶过程中会产生噪音,会对语音识别造成干扰。刘庆峰随即组织研发团队进行技术攻关,最终在2013年奔驰汽车举办的全球语音技术评测上,在超过时速100km噪声极大的苛刻条件下,只有科大讯飞的技术能够流畅使用。如今,科大讯飞跟奔驰、宝马、奥迪、福特和沃尔沃等知名汽车厂商都结成了合作关系。

独木不成林。语音交互说到底是一种行为习惯,要让用户从键盘输入的习惯切换到语音交互上,单凭科大讯飞一家难成大气候。

2010年10月,科大讯飞在业界率先发布了“讯飞语音云”平台。这个集成了语音合成、语音搜索和语音听写等交互能力的云平台,不但可以成为语音数据库的重要来源,还让更多的草根创业者可以免费借此进行语音产品的研发和测试。

这一战略布局看似开放了核心技术,但实则为科大讯飞的未来带来了不可估量的收益。一方面,讯飞语音云不仅扶持创业团队,还跟携程、新浪微博和58同城等大公司合作开发APP,在铺开语音交互功能的同时,还借船渡海般地获取了大量用户;另一方面,讯飞语音云通过跟大公司的收费合作直接获取收入,而将创业型公司扶持到一定规模后也会与其共享收益,由此产生源源不断的经济效益。

与此同时,科大讯飞还利用讯飞语音云,自己开发了讯飞语音输入法、灵犀语音助手和酷音铃声等一系列APP产品,抢占市场终端。时至今日,讯飞语音云的合作伙伴超过3万家,终端用户数量突破4.5亿人。拥有技术壁垒和产业规模的科大讯飞,已是当之无愧的业界霸主,其在国际市场上仅次于美国纽昂斯公司,而在国内市场上难逢对手。

然而,高处不胜寒。“将来每一个手机、每一个电视、每一个玩具、每一个汽车都能听会说,这是一个必然的趋势。”认识到语音必将成为未来一大入口的公司,并非科大讯飞一家。2013年两会时,百度董事长李彦宏私下对刘庆峰说:“有领导来百度考察,发现我们也在尝试做语音搜索,就对我说,你们还是别做了,直接用科大讯飞的技术吧。你们的技术是很好,但我们必须自己做,这是我们的身家性命啊。”

更有趣的是腾讯。由于QQ具有天然的竞争壁垒和对语音的刚需,腾讯在移动QQ上直接采用了科大讯飞的技术,但在以语音为主打的微信上,为了保持核心竞争力,腾讯则采用自己的语音技术,哪怕技术水平还有一定差距。

“现在,你对空调说,调到20度,空调会自动降到20度。但在未来,你说调到20度,空调会提醒你,调到26度会既节能又制冷,还不会让你着凉。”

——这像极了科幻电影里的场景。从科幻到科技再到产业,15年至今,刘庆峰和他的学霸团队仍然在技术峭壁上不懈攀登,因为站得越高,听到的风才会越大。

(陈梅荐自《青年创业网》)endprint

猜你喜欢

语音
微信语音恐惧症
SCHMID语音交换系统维护与维修案例浅析
魔力语音
Magic Phonetics魔力语音
阿里公布新语音合成技术KAN-TTS
结巴
对方正在输入……
拜托,别再给我发微信语音了
微软语音识别错误率行业最低
蜜蜂语音报警信号被破译