APP下载

人形机器人的“三国演义”

2015-07-24方达

齐鲁周刊 2015年28期
关键词:人形图像识别三国演义

方达

人形机器人早在近一百年前就由捷克科幻小说家提出。在综合人类近几十年的科技精华后,机器人或许会是下一个技术爆点,像其他电子设备一样走入人类生活的方方面面。

不久前,台湾鸿海联手日本软银以及大陆阿里巴巴推出一款人形机器人Pepper。这款售价约1万元人民币的机器人,首批300台在推出1分钟内就被抢购一空。

据悉,Pepper具有识别表情和对话的能力,可用于导购和照顾老人病患,是世界最著名电子生产企业与IT风投公司、互联网公司的一次强强联合,昭示着机器人正从科幻、科研、生产逐步走入人们的生活中,使得人形机器人产业竞争愈演愈烈,处处上演“三国演义”。

全世界四成机器人在日本

仿生机器人,是一种在外观上模仿人类或其他生物的机器人。近几年,日本人对于其中的人形机器人有着近乎狂热的追逐。

据了解,目前全世界有四成机器人在日本,日本也是世界上拥有机器人最多的国家。

日本在机器人方面的强大是有其深厚工业基础的,控制机器人精密动作的伺服电机,主要被日本、德国、美国所垄断,其中包括了被大众熟知的松下、三菱等企业。

在日本,有非常多的公司已推出机器人成型产品,包括面向企业和大众。这些人形机器人价格都不菲,从几万美元到几百万美元都有。其中最有名的当属日本本田公司的ASIMO人形机器人,外形酷似宇航员,具备听觉和视觉。ASIMO可以识别人类的面部表情和听懂人类语言,最重要的是其手和脚都可以完成复杂的动作。他的手可以完成拧开杯盖的动作,甚至能够打出手语,双脚可离地奔跑,最高时速能够达到9公里。

今年国际消费类电子产品展览会(CES)上,东芝公司推出了一款“美女”机器人,“她”能够实现手语交流,并拥有全球最高级的面部表达能力。可以通过43个气压传动装置,提供安静、迅速、流畅的肢体运动。这款“美女”机器人,其主要用途是为老人和病患提供帮助。

而且除了日本的企业,美国也有公司在研发类似产品,其中一家名为“波士顿动力”公司,近期开始步入公众视野。

据悉,“波士顿动力”公司成立于1992年,并在前年被谷歌公司收购。之前,波士顿动力一直与美国军方有合作,最著名的是BigDog的机器狗项目。这种机器狗可以在各种复杂地形包括光滑冰面行走,被人踹后也能保持平衡而不倒。同时,该公司还有Atlas双足站立的机器人,也由美国军方赞助,他拥有两套视觉系统和在崎岖地形行走攀登的能力。

显然,美国的企业是看中了机器人在战争中搜索侦查和背驮货物的能力。

当然,人形机器人在机械方面还存在着不少问题,由于人类四肢的复杂度,对于机械部件设计有着很高的要求。而且直立行走能力还有很大的改进空间,从近期国外举办的机器人奔跑大赛中可以看出,直立行走对于技术积累不足的企业来说,还是一个很大的挑战。但鉴于日本企业几十年来在硬件上的技术积累,他们能在人形机器人上取得如此成就也不足为奇。在这方面,让人感叹日本机械和电子工业的发展高度。另一方面,也让人产生疑问:日本是不是对机器人的外观,太过于执着而忽视了其内在呢?

美国,专注于机器人内在研发

相比于日本,美国企业对于仿生机器人的关心程度并不是很强烈。但除了在机械方面的技术,美国在机器人的内在上,即人工智能方面的研究,还是要比日本深入得多。

早在上世纪90年代,美国的国际商用机器公司(IBM) 就在研发专门用于国际象棋的超级电脑深蓝,这台电脑在经历首次挑战失败后,于1997年打败了当时的国际象棋冠军,名噪一时,第一次引发了人们对于未来人工智能技术的担忧。之后,IBM并未停下脚步,而是紧接着又开发了人工智能计算机系统“沃森”(Watson)。它在2011年参加了美国的电视智力节目,并打平了两位人工对手。

据悉,“沃森”的处理速度相当于每秒读完100万本书,而且并未联网。如此强大的知识储备远非人类所能比拟,但它的问题主要在于对描述较少问题上的无力。上个月沃森完成了对1900个TED公开课课程的学习,这些内容足以让一个人从生到死都学不完。

美国还有一家软件公司Wolfram,于2009年推出问答搜索引擎Wolfram Alpha(W|A)。

这一搜索引擎不同于我们通常所用的谷歌与百度,W|A会直接给出问题的答案,作为一家数学软件公司,Wolfram Alpha能轻易回答各类数学问题,解答数学问题不必借助软件,直接在搜索中求解就行。而且W|A还可以回答物理化学乃至人文历史等方面的问题,比如询问“现任美国总统夫人是谁”、“乔布斯的生卒日期”,W|A均能直接给出答案,从而省去了在搜索结果中自己组织答案的过程。

目前,W|A强大的问答系统,已经被苹果公司的Siri语音助手采用。

在语音识别技术上,美国三家科技公司苹果、谷歌、微软都在加紧布局。Siri、Google Now、Cortana三款智能语音助手,已经成为各家操作系统的一大卖点。苹果的Siri得益于布局早以及iOS设备较高的普及度,Google Now凭借谷歌十几年在搜索引擎上的深耕,微软Cortana则利用在PC操作系统上的霸主地位,三家各具优势,未来还将在该领域里继续厮杀。同时,谷歌、微软、Facebook等公司,也在图像识别领域里开始发力。以图搜图、识别图像内物品、人像识别都是图像识别的重要应用。而今年谷歌推出的Photos应用,打开了图像识别技术实用化的大门,使Photos智能整理照片的功能初露端倪。可以说,未来图像识别的发展方向,即代替人类进行繁复的整理审查工作。

总之,与日本企业不同,自计算机技术革命以来,美国一直在软件领域处于领先地位。

在家用机器人硬件还无法进入寻常百姓家的情况下,美国企业首先在软件方面发力,依托于互联网上的云计算技术和手机、PC等现有移动设备,将“机器人”引入生活。这条道路,显然比日本要好走得多。

中国还仅仅是展露头角?

相比于日本企业对机器人的钟情,在中国国内,由于技术积累的劣势,目前看人形机器人还落后于美日等国家,仍然主要处于高校研究的阶段。

当前,哈工大、清华、上海交大等高校的机器人研究,在国内外已经颇具名气。但在企业方面,如新松等知名机器人公司还是以提供工业生产为主,目前还尚未有人形的民用级产品问世。但在软件方面,中国科技企业与西方国家的差距并没有硬件那么大,诸多实用化的人工智能产品已经问世。其中最大的中文搜索引擎百度,近来在图像识别方面奋起直追,招募了一些像吴恩达、余凯这样的人工智能专家。今年初,百度也声称识别错误率上已经低于微软和谷歌。不过,不久前ImageNet爆出百度作弊的“丑闻”,让原本公布的研究成果不可信,这也为百度人工智能团队抹上了一层阴影。

另外,中国还有一家叫作科大讯飞的科技公司,无疑在中文语音识别上处于领先地位。据了解,借助智能机的发展,科大讯飞推出了手机上的语音输入法和语音助手。而在这之前,该公司的文字转语音技术就曾在北京奥运会期间投入使用。相较于美国的企业,中国的本土企业在中文语音技术上具有民族情感与政策扶持的优势,已在中国的人工智能研究中率先展露头角。而不久前,台湾鸿海联手日本软银以及大陆阿里巴巴推出的一款人形机器人Pepper,依然有着明显的日系特征,1万元人民币的价格虽然不算太贵,但和手中移动设备相比并不具备价格优势,若和美国亚马逊推出的180美元智能音响Echo相比,则又劣势明显,而且Echo也一样能做到语音识别和语音合成发声的功能。

从亚洲文化来看,日本与中国企业的合作显然是要做出一款外形友善的智能机器人,它承载着更多情感的角色,而非呼之则来挥之即去的助手。因此,我们对Pepper也不必期望过高,毕竟它只是第一代产品,况且1万元人民币的价格和试水发售量,也让我们对它背后的技术支持产生怀疑。但Pepper的推出,是亚洲地区的企业在机器人领域的一次成功尝试,若要在这个领域有更大作为,日企、台企和大陆企业还应在软件上奋起直追,而不是把机器人做成徒有其表的玩具。

猜你喜欢

人形图像识别三国演义
世界上走路最快的人形机器人
《三国演义》骗了你多少年
基于Resnet-50的猫狗图像识别
会变形的人形机器人
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
图像识别在水质检测中的应用
人形蔬菜
三国演义
三国演义