APP下载

AI成精?谷歌AI机器人的背后

2018-06-26技术宅

电脑爱好者 2018年12期
关键词:订餐海量语音

技术宅

AI订餐 一场机器与人类的真实对话

电话订餐,相信很多吃货们都使用过。不过大家可能没有想过使用机器人来向商家订餐,因为虽然只是简单的对话,但是在对话过程中需要向商家确定诸如就餐时间、人数、包间等信息。另外还可能有许多“意外”发生,比如餐馆预约人数太多,就需要临时改变计划,经双方协作沟通才能最终顺利完成订单。这些对于人类来说可能非常简单,但如果全程是由机器人来完成的,我们就不得不惊叹机器人的智慧了。谷歌的AI订餐视频展示中,AI机器人就通过语音电话和实体餐厅完成了订餐活动,而且商家根本没有察觉是在和机器人对话(图1)。

AI订餐的背后——自然语言处理技术

很多人意识不到一次简单的订餐活动对AI来说有多大难度。因为在对话过程中,AI机器人需要理解、思考人类的回话,并作出得体的回复,这意味着机器人能够完全读懂并处理人类的自然语言。谷歌AI机器人是怎样拥有这些“超能力”的呢?

一方面要让AI可以“听”懂人类的对话,就需要让机器人熟悉人类的对话场景。谷歌科技人员准备了海量的对话场景,并通过这些场景对机器人进行训练(上述订餐的例子中,谷歌就将我们常用的订餐对话输入到机器人的数据库中进行训练)。通过海量的数据训练后,AI机器人基本熟悉人类某个场景的对话,就知道该怎么与对方进行交流,从而可以在接收对方的回复后选择合适的语句进行回复。

另一方面借助AI强大的自我学习能力,它可以在海量数据训练后实现自我学习和提高。在谷歌展示的订餐视频中,AI机器人在整个对话中语气非常自然,包括停顿、缩略语,甚至会在回复中增加一些看似“无用”的口语性语气助词“Mmhmm”、“uh”等,这些语气助词的出现非常自然。这是AI典型的自我学习能力,这种逼真的模拟场景让对方根本不知道是在和机器人对话(图2)。

为了让机器人的发音显得更加自然、逼真,谷歌借助强大的TTS引擎技术,不仅可以使AI机器人的语音和人类的语音非常类似,还可以根据不同的情境控制语音的语调,这样使得AI的发音、语气、语境水平和真正的人类相差无几。在上述订餐视频中出镜的就是谷歌智能助理Google Assistant,它成功地“骗”过人类,完成了一项人工电话订餐(图3)。

AI机器人成功订餐视频,展示的实际上是谷歌在自然语言处理方面的技术积累。谷歌赋予了AI机器人进行多轮自然对话的能力,也是通过这种多轮对话能力的延伸,谷歌联合使用了一个级联TTS引擎和一个生成式TTS引擎,来根据不同的情境控制语音的语调,让AI机器人的语音对话达到了和真正的人类相比都难以区分的地步。

当然类似人工智能的应用,同样出现在谷歌的其他产品中。我们常用的Gmail新增了一种全新的智能回复功能——Smart Compose,通过机器学习理解一封邮件的上下文,这样在你写邮件时都不用将一个句子写完,机器学习就能通过理解帮你补全你想说的话,实现非常智能的回复(图4)。

AI智能 还可以带给我们更多好处

从上述介绍可以看到,AI不仅可以理解人类的对话,而且可以根据人们的需要智能协助完成很多的工作。将上述AI订餐机器人的技术应用到大型超市、热门景区等场所的前台,就可以完全实现无人化操作,甚至可以提供比人工客服更好的导游服务。

一些APP上的人工智能,比如 Google Photos,可以帮你一键分享照片给同框入镜的好友,这样一起出游的朋友在完成合影照片上传后,同框好友就会自动收到合影照片。再如Google Map运用图像识别实景导航,这样在手机上使用谷歌地图导航时,前面商店、餐馆、加油站的信息会自动显示出来,成为一个非常智能的导航专家(图5)。

当然AI应用场景还会出现在我们生活的方方面面。在手机上练习英语口语,每读一句话,AI会给你打分;当你洋洋洒洒写完一篇作文,AI会圈出作文中出现的多词、缺词、错词和次序错误等……总之,随着AI技术的发展,它必定会给我们的生活带来各种意想不到的便利(图6)。

猜你喜欢

订餐海量语音
一种傅里叶域海量数据高速谱聚类方法
魔力语音
海量快递垃圾正在“围城”——“绿色快递”势在必行
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
一个图形所蕴含的“海量”巧题
基于文件系统的分布式海量空间数据高效存储与组织研究