人工智能会叛逃？从下棋开始谈起.......

2019-05-23

求学·理科版 2019年5期

关键词：胜率落子李世石

什么是人工智能？

很多人都以为“人工智能=会思考的机器人”，然而事实并非如此。人工智能的定义其实相当宽泛，从学科定义的角度来说，它是研究、开发用于模拟、扩展人的智能的一门新学科，属于计算机科学的一个分支。

人工智能简史

从“网红”AlphaGo的学习方式看人工智能

“网红”AlphaGo（阿尔法狗）是人工智能中一个成功的典型，赢了韩国棋手李世石，令众人皆知。

一、AlphaGo的获胜秘诀：深度学习

深度学习的前身是神经网络，主要是指研究人员通过程序语言教会电脑模拟人类思考。比如我们初学“1+1=2”的时候，父母教我们通过数手指头的方式来计算;而研究人员教电脑学习的方式则比较简单，输入的是已知信息，其中“1”和“+”就是输入给电脑的，电脑输出的就是结果“2”（电脑上是采用“二进制”进行计算的，感兴趣的同学可查阅更详细的资料）。无论是通過计算、判断还是推理，像这样认知的过程都可以称为“学习”。

二、深度学习=“监督学习”+“评价网络”+其他

1.“监督学习”

打个比方，一个拥有过目不忘的超能力的同学，根本不用学习方法原理和解题技巧，只要记住近乎无限量的题目和答案，考试就能得到高分。同理，AlphaGo不用学习下棋的方法，只要有充足的存储空间就够了。设计人员向其大量输入这个世界上职业棋手的棋谱（也就是说它记住了题目和答案），以预测对手最有可能落子的位置。

用这种学习方式，AlphaGo完全不用去思考“如何才能赢”这件事，只要能够预测对手的落子即可。公开数据显示，目前AlphaGo预测对手落子位置的正确率是67%。

2.“评价网络”

举个例子，在打篮球时，某同学会不断观察对方防线变化，如果能找到防守球员注意力最不集中的地方，就有较大的机会进球。类似地，AlphaGo会预测对手后续落子位置的概率，通过嵌套函数找到最优解。当然，AlphaGo的胜率跟向下预测的步数有关，向下预测的步数越多，计算量就越庞大，同时胜率也越高。

但是AlphaGo的能力显然不止于此，除了预测对手落子后的胜率，它还会模拟自己落子后可能会遇到的情况。就像考生不断地出试卷考自己那样，AlphaGo除了会和对手下棋，还会和自己下棋，以确定自己下一步怎么走胜率最高。在未来，设计人员还会将一个评估体系植入AlphaGo当中，使其能够更加准确地评估所下这一步棋的好坏。

一言以概之，这种机器学习方式不局限于一步的输赢，而是将格局放大，更关注最后结果。

看到这里，同学们应该明白了：其实并不是AlphaGo打败了李世石，而是研究人员用智慧战胜了李世石。除了监督学习和评价网络，人工智能学习的方式还有很多。与人类相比，它们不仅“过目成诵”，而且其拥有的超高的计算速度和准确性也让人类望尘莫及。

作者简介：大宝，人工智能爱好者，算法工作者，目前在一家区块链创业公司工作。