APP下载

人工智能 新纪元

2018-03-02方陵生

大自然探索 2018年1期
关键词:机器人工智能机器人

方陵生

“机器能思考吗?”能够模仿人类智慧的计算机曾经只是一个遥远的梦想,人工智能研究几经跌宕起伏,最终取得了意料之外的成功。如今,人工智能已神奇地进入我们生活的各个方面,但却是以与当年预言者所想象不到的方式……

60年前科学家的预想

1956年夏天,一群科学家和工程师在美国达特茅斯学院聚集一堂,其中包括计算机科学家马文·明斯基,信息理论家克劳德·香农,以及后来的两位诺贝尔得主赫伯特·西蒙和约翰·纳什。他们聚在一起的任务是要创建一个被称为“人工智能(AI)”的新的科学领域。

这群科学家不乏雄心壯志,他们认为:从理论原则上来说,包括学习能力和人类智能等其他任何一个方面,都能用机器模拟的方式准确地表现出来。可以让机器学会使用语言,形成抽象概念意识,以解决人类目前面对的一系列问题,提升人类自身能力。他们甚至预计,通过这帮精英科学家用一个夏天的集思广益,就一定能够取得其中一两个问题的重大进展。

结果,为实现人工智能之梦,他们花了远远不止一个夏天的时间。在经过60年不懈的努力和许多次的失败挫折之后,人工智能终于走出了自己的发展之路。到了今天,我们可以向电脑提问,可以坐在半自动驾驶汽车里在繁忙的车流中穿行,可以通过智能手机进行演讲材料或文本材料的多种语言翻译;我们还可以将护照检查、拼写错误修正这类事情都放心地委托给计算机去做。不过,我们很难想象,如果一旦计算机系统出现重大故障或崩溃,会给我们已经如此习惯并依赖于人工智能的社会秩序带来多大的影响。

当人们迅速适应了人工智能给我们带来的种种便利之时,我们也许并不清楚,当年科学家设想的人工智能其实并不像今天人们所体验到的这样。

在当年的达特茅斯会议上,以及随后召开的各种会议上,明确提出的人工智能这一领域的未来目标是机器翻译、计算机视觉、文本理解、语音识别、机器人控制和机器人学习。虽然在之后的几十年里,大量资源投入了人工智能的研究,但并没有达到其中任何一个目标。直到1990年代末,1956年科学家预言的人工智能研究才开始有了转机,人工智能的种种神奇才纷纷开始融入人们的社会生活之中。

今天,虽然可以说已经达到了当年的预期目标,但创造人工智能的方法却有了很大的不同。早期的工程师设计人工智能的办法是从头到尾为机器全程编程,他们创建的人工智能行为采取的是一种“自上而下”的途径:首先创建一个如何处理语音、文本或图像的数学模型,然后通过计算机程序实现这个模型中预想的功能。这听起来是一个很合理的设想,但结果证明是错了。他们还预测,人工智能的任何突破都将有助于进一步了解人类自身的智慧,但结果也错了。

1956年后的多年中,越来越明显的是,当年设想的这些系统并不适合处理现实世界中纷杂的各种问题。到了上世纪90年代初,由于人工智能领域几乎没有取得任何进展,大多数工程设计人员开始放弃了以逻辑推理方式创造一种万能型思考机器的梦想,他们开始将目光瞄准了一些较具体的低级目标,专注于让机器完成某个更有希望解决的特定任务。

一些早期的成功事例来自于产品的推荐。虽然很难了解为什么客户会想要购买某种产品,但根据之前的交易或其他类似客户的喜好,却很容易推断他们可能会喜欢什么样的产品。例如,如果你喜欢《哈利波特》系列的第一部和第二部电影,那么你很可能也会喜欢第三部。要获得某种解决方案,你可能不需要很深入的全面理解,就可以通过对大量数据的分析梳理,发现其中有用的相关性。

那么,有没有办法让机器通过相类似的“自下而上”的捷径来模仿其他形式的人类智能行为呢?关于人工智能领域的许多问题虽然没有现成的理论,但却有足够多的可用以分析的数据。正是这种务实的态度导致了一些AI技术的诞生,如语音识别、机器翻译,以及像手写体数字识别这样简单的计算机视觉任务。

数据比理论更强大

到了2005年左右,人工智能已有了大量的成功例案例,在走向成功之路的过程中,人工智能的研究获得了一个强大的经验教训:数据比理论模型更强大。在以一个小集的统计学学习演算法和大量数据为启动动力的基础上,创造和诞生了新一代的智能机器。

研究人员曾假设,人工智能将为进一步了解我们自己的智慧提供线索,但尝试从机器算法来了解人类大脑是如何执行这些任务的,这纯属是浪费时间。人工智能的语言不再是通过逻辑表达,而是通过数据比对算法。AI领域在经历了一次思考模式的转变后,进入了数据驱动的人工智能时代,新的核心技术是机器学习,其语言不再是逻辑语言,而是统计数据语言。

那么,机器会学习吗?我们通常所说的机器人学习指的是机器建立在其经验分析基础上的改变其行为的学习能力(当然希望是向更好的方向改变)。这听起来有如变魔术般神奇,但实际上在很大程度上是一种机械的过程。

想象一下,你邮箱里的垃圾邮件过滤器是如何根据邮件内容来对大量邮件进行筛查,以做出是否要将它们阻挡在外的决定的呢?每一次你将某份电子邮件拉入到垃圾邮件文件夹时,AI就能通过收件人给出的信息,以及是否含有收件人不需要的词语等线索来估算其属于垃圾邮件的概率。综合所有这些信息,就可以对新邮件做出判断,是否要将它阻挡在外。对于AI来说,并不需要对邮件有很深刻的了解,它所要做的只是根据统计学原理计算一些字词出现的频率,然后做出判断就可以了。

将这种思路大规模付诸实际应用所取得的效果之好令人惊讶。机器可以学会做一些很难直接编程的事情:比如将不完整的句子补充完整,预测用户下一次的鼠标点击行为,或者推荐某个产品等。当以这种思路开发人工智能达到极致之时,机器为我们做到了许多之前难以想象的事情,比如语言翻译、手写识别和人脸识别等。与60年前科学家对人工智能未来的假设完全不同的是,让机器模拟人类行为,我们并不需要对具体的功能进行精确的描述和编程。endprint

虽然具体到个别的每一种机械行为都相对简单,但当我们在复杂的软件中同时部署了许多这样的机械行为,并为其提供了数以百万计的数据实例后,其产生的效果就是,这种高度自动适配的行为,使得机器看起来就像真正拥有人类一样的“聪明”。但值得注意的是,这些都只是简单的统计学计算结果,机器并不了解为什么要这么做,它只是“知其然”,而并“不知其所以然”。

更多的数据优于更好的算法

人工智能研究的这一重大发现有时被称为“数据的不合理的有效性”。对于人工智能研究者来说,这是看似微不足道但却很重要的一课:简单的统计学方法,结合大量的数据,解决了困扰人工智能理论学家几十年苦思不得其解的机器人行为的难题。

通过机器人强大的学习能力和庞大的可用数据集,终于实现了一些有实际用途的人工智能系统,包括视觉、语音、翻译和自动问答系统等。将这些系统融入更大的系统中,产生了一些功能更强大的产品和服务,从Siri(iPhone/iPad上的语音控制功能)到亚马逊购物网,再到谷歌的概念车。

如今,研究者的注意力正集中于点燃人工智能机器“发动机的燃料”:数据。人工智能从哪里获取数据,并如何开发利用这些数据资源呢?

有价值的数据可以免费在“自然环境中”找到。人们在各种活动中生成的副产品,如在博客上共享的一个推特,或用户添加的一个笑脸符号等,这些司空见惯的网络行为都是人工智能的数据来源。

工程师和企业研究人员已经发明了各种各样的方法来吸引和收集各种额外的数据,如记录用户上网行为的cookie(储存在用户本地终端上的数据),标记朋友圈,评价某件商品等。这些数据都会成为新的庞大数据流中的一部分。

同时,随着人工智能找对了自己的发展方向,研究人员已开发了一个前所未有的全球数据网,每当你上网看新闻、搜索信息资料、网购、玩游戏、查看你的电子邮件或银行存款余额时,你都在与这个庞大的数据网展开交互活动。这个数据网的基础设施不只是实体形式的计算机和电线网络,还包括社交网和微博网站等在内的由诸多软件构成的一个大网络。

数据驱动的人工智能从这个网络中吸收大量数据,同时利用这些数据为这个网络提供动力。很难想象现代生活缺少了这样的数据交流会是个什么样子。

人工智能的成就与挑战

现代人工智能已成为现代科技中最了不起的强大技术之一,也是一项颠覆性的技术。

这个强大的数据网络非同一般,与之前人类所发明的任何媒介如电报或电话时代的通信网络等都大不一样,它对我们的行为和行动都非常“感兴趣”。当我们在网络上浏览时,它也反过来“看着”我们,预测我们下一步的举动,猜测我们的意图。通常目的是为给我们提供更好的服务,有时也会对我们的行为产生影响。1970年代通信理论家马歇爾·麦克卢汉的名言是“媒体永远无法保持中立”,人工智能赋予了他这句话以一种全新的诠释。

人工智能在给我们带来诸多便利的同时,也有可能会给我们带来诸多困扰,如监视、歧视、诱导、失业甚至成瘾。面对这些挑战,我们做好准备了吗?

智能机器要能运转起来,就需要收集大量数据,通常包括一些涉及个人隐私的数据。但这个简单的事实却有可能将人工智能机器变成监视我们个人行为的设备:它们知道我们在什么位置,了解我们在网上浏览的历史,对我们的社交网络也一清二楚。我们能决定谁可以有权访问我们吗?我们能知道收集的数据都用来做什么了吗?以及这些数据是否会被删除?如果答案是否定的,那么我们就已经失去了对它们的控制。

人工智能在保险、贷款和治安监控中都非常有用,但预测质量取决于微妙的设计选择,以及信息收集的方式。但它也有产生意料之外隐形歧视的风险,就像不同的招聘广告针对的是不同的族群,这些都显示了通过算法和数据之间复杂的相互作用对我们所产生的种种影响。

另一个问题是诱导。许多人工智能公司的商业模式是做广告,它们会引导人们点击某些特定的链接,这些公司致力于研究如何引导用户进入这些链接。机器对我们了解越多,推动和影响我们的能力就越强。对于一些易受影响的用户来说,通过提供所谓的“丰厚奖励”,甚至会诱发网络上的一些成瘾行为。

人工智能或是通过观察我们如何做,或是通过“训练”人工智能的大量数据,从我们这里学会如何做某些工作,对就业形式也会产生很大影响。互联网上出现的众包,可让企业自动将一些需要人类智能完成的微型任务在网上“外包”出去,通过在网站或应用程序中发布任务,人们可以选择他们想要接受的任务,并通过计算机系统加以协调。典型的外包任务包括辨识手写体或标记图片等。

由此创造了一个直接通过计算机管理的劳动力大军,并定义了一整套理想的可自动化管理的候选任务。事实上,许多基于任务的工作者实际上是在为训练AI生成或注释数据。同时,我们可以预期,许多呼叫中心和仓库管理在未来十年里的自动化程度也将越来越高。

我们的法律和文化也许不足以应对这些和其他许多挑战。如果某个智能算法可以否认我们的假释决定或治疗方案,我们该找谁去说理?我们希望政府可以随时访问我们的网上活动,了解我们的偏好吗?我们希望我们的孩子一直在控制诱导他们行为的“循循善导”的机器的陪伴下度过他们的上网时间吗?如果因人工智能的发展而导致大量失业,对我们这个社会又会产生什么样的影响呢?

从早期的学术理论到如今广泛的实际应用,人工智能已经走过了一条很长的路。AI现在正在融入我们的生活,并展示了进一步发展的前景。在实际应用中,我们也许并不将其称为AI,但在它们所融入的诸多领域中,从医疗保健到公共交通,从通信交流到学校教育,人工智能都和我们如影相随。

机器学习范式已有效地解决了包括视觉和语音处理在内的许多问题,未来的人工智能也许能找到将早期研究留下来的“自上而下”推理方法的成果完美结合起来的办法,届时,AI能够做的事情可能会再一次给我们带来巨大的惊喜。endprint

随着人工智能继续开辟新的可能性,可以想象,我们将能够像面对人类一样与机器人对话,让机器人为我们流利地进行即时翻译,并在智能房屋和自动汽车领域内开发出更多的自动化实际应用。

但是,我们仍然需要抵制将人工智能引入尽可能多领域中的诱惑,至少在文化和体制同时得到相应进展之前,我们必须谨慎从事。广泛采用的人工智能技术给我们人类带来许多非凡的机会,但同时也存在着一些潜在的风险。与流行看法相反的是,人工智能威胁到的并不是人类作为一个种族的安危,而更有可能的是AI对我们的隐私和自主权的侵蚀。

人工智能已进入我们日常生活的各个方面,在庆贺AI取得的巨大成就,享受60年来人工智能研究带来好处的同时,对于人工智能潜力的深入开发我们仍需三思而后行。

人工智能发展时间表

1950年:英国数学家、计算机之父阿兰·图灵在他发表的论文“计算机器与智能”中,开宗明义第一句话就是“我开始考虑这个问题:机器能思考吗?”

1956年:在达特茅斯学院举行的一个研讨会上,正式创造了“人工智能”一词。

1959年:卡内基梅隆大学计算机科学家开发了程序软件“通用解题程序”——一个可以用来解决逻辑谜题的程序。

1973年:由于缺少资金,第一次AI之冬来临。

1975年:一个被称为MYCIN的医疗诊断系统被开发出来,可用于诊断细菌感染,在一系列问答的基础上进行推理,提出使用何种抗生素的建议,但这一系统一直没有被投入实际使用。

1987年:第二次AI之冬开始。

1989年:美国宇航局AutoClass计算机程序发现了多个之前未知的恒星类型。

1994年:第一个互联网搜索引擎启动。

1997年:IBM的深蓝击败了国际象棋世界冠军卡斯帕罗夫。

1998年:美国宇航局的Remote Agent是首个控制飞行中宇宙飞船的全自动程序。

2002年:亚马逊网站以自动化系统取代了人类产品推薦者。

2007年:谷歌推出机器翻译服务。

2009年:谷歌研究人员发表了一篇有影响力的论文,题目为“数据的不合理有效性”,文章称“基于大量数据的简单模型比基于较少数据的复杂模型更胜一筹”。

2011年:苹果公司推出Siri声控私人助理,它可以回答问题、提出建议和执行指令,如“打电话回家”。

2011年:IBM的超级计算机沃森在电视智力竞赛大冒险中打败两位人类冠军。

2012年:谷歌的无人驾驶车可自主导航上路行驶。

2016年:谷歌AlphaGo程序击败世界顶级围棋棋手李世石。

机器的成功与失误

最有名的机器学习成功例子之一是名为“阿尔法狗(AlphaGo)”的计算机于2016年击败了韩国围棋大师李世石,如此强大的能力即使是所有为机器编程的程序员也望尘莫及。阿尔法狗综合了各种机器学习方法,对超过3000万步棋子走法,以及成千上万盘棋局的数据库进行了分析。之前IBM的沃森超级计算机也是通过类似的方法在电视智力竞赛大冒险中战胜了人类选手。

只要输入正确的数据,机器就可以通过对大量数据的分析来提高其智力。但是我们应该记住的一点是,机器学习是一种基于统计学的练习,因此它也有可能会出错。

近年来机器学习造成失误的事例也时有发生。例如,2015年谷歌因其产品自动将两位黑人的照片标记为“大猩猩”而公开道歉;2016年微软因一款名为Tay的对话机器人竟然学会了攻击性语言而不得不将其撤回。这两个例子都不是算法上的失误,而是因给机器人馈入了不当训练数据而导致的。

2016年还发生了首例“无人驾驶”汽车导致的死亡事件。一名司机在驾驶特斯拉车的过程中启动了自动驾驶功能,但计算机视觉系统未能检测到天光背景下的白色障碍物——一辆白色车身的拖车,从而迎面撞上,导致司机身亡。这种情况很罕见,但随着更多公司介入自动驾驶车辆这一市场,但愿这样的机器失误是第一次,也是最后一次。

另一方面,人工智能系统正在更多的领域内发挥它们的作用,包括网络上的搜索引擎、网店销售系统和半自动汽车等。

我们可能会将越来越多敏感的决策委托给机器人,因此在给机器人馈入学习数据的时候必须要更加慎重。机器人技术涉及的不仅仅是技术,同时也是对我们日常生活秩序更深刻的理解。endprint

猜你喜欢

机器人工智能机器人
机器狗
机器狗
2019:人工智能
未来机器城
数读人工智能
下一幕,人工智能!
机器人来帮你
认识机器人
机器人来啦