APP下载

人脑和电脑的恩怨情仇

2016-09-21叶子

高中时代 2016年7期
关键词:走法棋类人机

叶子

所谓人工智能,还是对人自身的研究,从有自我意识开始,人类一直在认识自己,并通过认识自己让生活变得更美好。我们能认识到心脏的运作机制,造出心脏起搏器,但这和造出一个完整的心脏是两回事,同样,我们能让电脑下棋赢了人类,这和能造出一个大脑是两回事。

前不久,谷歌的“阿尔法围棋”AlphaGo和韩国九段围棋手李世石之间的人机世纪大战引起了全世界人民的关注,AlphaGo最终以4:1取得胜利。虽然很多人都庆幸人类并没有输得毫无还手之力,但AlphaGo也有自己的收获:由于在第四局比赛中输给了李世石,AlphaGo也有了自己的WHR排名,它以9胜1负的战绩,积3586分,排名世界第二,仅次于中国九段棋手柯洁。

此次人机大战,无论在围棋界还是人工智能界,抑或是在普通民众间,都引发了轩然大波。但在这场被全球围观的人机大战中,似乎只有赢家,没有输家。

为什么是围棋

其实早在1996年,美国IBM公司就开发出了一款国际象棋超级电脑——“深蓝”,它在正常时限的比赛中首次击败了排名世界第一的棋手。不过,那次的比赛似乎并没有引来多少关注,而这次人机围棋大战却成了全球的聚焦点,为什么?因为它“胆敢”选择围棋!

传统的计算机程序在参与棋类游戏时,往往会使用“暴力计算”的做法,即为所有可能的步数建立搜索树,也就是根据数学和逻辑推理的方法,把每种可能的路径都走一遍,从中选出最优的走法。

而围棋棋盘有361个点,走法变化繁多,其他棋类游戏望尘莫及。围棋的“分支因子”无穷无尽,19×19格围棋的精确合法棋局数的所有可能性是一个171位数——比宇宙中的原子数还多。这样的计算量,哪怕是巨型计算机也要算上许多年。此外,由于围棋的每颗棋子都相同,没有大小的区分,这就使围棋的下法中增加了很多“随机”的成分,无法用逻辑推理来预测(譬如在象棋中,不同的棋对应有不同的下法规则,而围棋则没有这些限制)。因此,进入围棋领域一直被认为是目前人工智能的最大挑战。

AlphaGo是怎么学围棋的

那么AlphaGo是怎么学习围棋的?难道还靠“暴力计算”吗?答案显然是否定的。

简单来说,AlphaGo之所以可以玩转围棋,主要在于其拥有两个大脑——负责选择下一步走法的“策略网络”和负责预测比赛实时胜利者的“价值网络”。每走一步,它俩估算一次获胜方,而不是像“深蓝”那样一直搜索到比赛结局,从而减少了运算量。两个大脑的配合工作,将围棋巨大无比的搜索空间压缩到可以控制的范围之内。

仅仅这样还不够,想要战胜人类,AlphaGo需要做的第一步就是模仿人类。设计人员首先让它“学习”了围棋专业棋手的3000万步实例,完成“价值网络”的基础训练课程。通过这种经验学习,AlphaGo对于人类围棋走法的预测准确率就已达到57%,之后,等待AlphaGo的便是试着超越人类。与以往的计算机不同,AlphaGo最特别的地方就在于它可以“深度学习”——像人类大脑一样自主学习,不断提升棋艺。这才是AlphaGo最令人可怕的地方。

简单来说,AlphaGo可以自己与自己对弈(目前它已自我对弈超过3000万局),在这个过程中,它不断积累着胜负经验,还举一反三,形成它对围棋的一种“全局观”,甚至形成自己对于围棋的一种“思考”。

伴随着自我学习的不断深入和对弈次数的不断增加,AlphaGo会越来越少地依赖过往的经验,转而越来越多地依靠自己的评价网络,带有创新性地选择最有利于自己的走法。在围棋世界里,AlphaGo是学霸中的学霸。

人类还剩下什么?

本次人机大战胜负已然分明,许多网友开始幻想,究竟在什么棋类项目上,人类能够有把握战胜人工智能,或者至少不会输得很惨。最终的讨论结果是飞行棋——主要依靠运气的游戏。

其实除了围棋,人工智能已经从各个方面开始挑战人类,比如与棋类游戏不尽相同的麻将或是牌类游戏。在这类游戏中,玩家能够掌握的信息是不完整的,无法控制诸如对手的底牌以及下一张来牌等因素,因此属于不完全信息博弈,计算难度成倍上升。不过,日本东京大学却开发了一款麻将机器人——“爆打”。“爆打”和 AlphaGo一样,有自我对弈以及阅读学习人类牌谱的能力。从2015年到2016年,“爆打”已经打了约13万手牌,平均成绩在六段以上。2015年,加拿大研究人员则开发了能够玩转德州扑克的智能机器人(仅限于双人限注模式)。无论对手是谁,这款德州扑克机器人都能保证至少不输。

来自英国的科学家比尔·西蒙斯早在十几年前便开发了“大奖章基金”,这是一款可以应用于投资领域的人工智能。当年他请来一位统计学大师和一位数学家编写模型,然后让电脑程序完全自主操作。“大奖章基金”通过对历史数据的统计,找出金融产品价格、宏观经济、市场指标、技术指标等各种指标间变化的数学关系,从中发现市场目前存在的微小获利机会,随后执行快速且大规模的交易。迄今,“大奖章基金”仍然保持着34%的年化收益率,如果你在20年前向他投资一万元,那么今天它会回报给你348万,这样的投资效率完爆投资巨鳄巴菲特和索罗斯。

而在艺术方面,智能机器人已经创作出既合乎乐曲规则又符合人类审美的音乐,它们甚至可以创作出具有巴洛克时期或是古典主义早期风格的乐曲,许多听众甚至都无法分辨乐曲的真正创作者是机器人还是人类。在韩国《金融新闻》编辑部,有一位特殊的人工智能记者。这位“记者”在得知当天的股市数据后,能够在短短0.3秒内完成一篇股市行情的新闻报道,读者在字里行间同样无法发现人工智能的影子。

说来辛酸,如今还未被人工智能征服的领域恐怕就还剩体育了,它们在短时间内根本无法在该领域与人类对抗。人体结构的精妙复杂,肌肉和骨骼的完美配合,让科学家都“望人兴叹”。人机大战后,很多体育迷开始研究,哪些运动是人工智能还远不能战胜人类的“净土”,结果排名第一的是足球。从目前的技术来看,机器人的射门还不错,角度精准且力量十足,但它们想要玩出“圆月弯刀”、“蝎子摆尾”等动作,恐怕还为时尚早。机器人目前最差的一项技术就是守门,机器守门员的反应绝对比《疯狂动物城》的树懒还迟缓。

不过,这并不意味着人工智能不会在某一天向人类运动员发起挑战。或许在不久的将来,人类将不得不派出最强11人,去和冷酷的钢铁洪流一决雌雄,可能人类仅有的一丝骄傲感也会在那时荡然无存。不过可以预见,场面一定会比今日的人机大战更为壮观。

猜你喜欢

走法棋类人机
从内到外,看懂无人机
数对与象棋
人机对视
水下无人机:解锁钓鱼新姿势
马踏连营
许银川先胜万春林
一共有多少种走法
棋类游戏
棋类游戏
棋类游戏