AlphaGo的神奇全靠它,详解人工神经网络!( 二 )


经过这两个阶段的训练,神经网络就可以同围棋业余爱好者下一盘不错的棋了 。但对于职业来讲,它还有很长的路要走 。在某种意义上 , 它并不思考每一手之后的几步棋 , 而是通过对未来结果的推算来决定下在哪里 。为了达到职业级别 , AlphaGp需要一种新的估算方法 。
为了克服这一障碍,研究人员采取的办法是让它反复的和自己进行对战,以此来使其不断其对于胜利的估算能力 。尽可能的提高每一步的获胜概率 。(在实践中,AlphaGo对这个想法进行了稍微复杂的调整 。)然后,AlphaGo再结合多线程来使用这一方法进行下棋 。
我们可以看到,AlphaGo的评估系统并没有基于太多的围棋知识,通过分析现有的无数场比赛的棋谱,以及无数次的自我对战练习 , AlphaGo的神经网络进行了数以十亿计的微小调整,即便每次只是一个很小的增量改进 。这些调整帮助AlphaGp建立了一个估值系统,这和那些出色围棋选手的直觉相似,对于棋盘上的每一步棋都了如指掌 。
此外AlphaGo也使用搜索和优化的思想,再加上神经网络的学习功能,这两者有助于找到棋盘上更好的位置 。这也是目前AlphaGo能够高水平发挥的原因 。
3神经网络的延伸和限制回顶部
神经网络的延伸和限制
神经网络的这种能力也可以被用在其他方面,比如让神经网络学习一种艺术风格,然后再将这种风格应用到其他图像上 。这种想法很简单:首先让神经网络接触到大量的图像,然后来确认这些图像的风格,接着将新的图像带入这种风格 。
这虽然不是伟大的艺术,但它仍然是一个显著的利用神经网络来捕捉直觉并且应用在其他地方的例子 。
在过去的几年中,神经网络在许多领域被用来捕捉直觉和模式识别 。许多项目使用神经这些网络,涉及的任务如识别艺术风格或好的视频游戏的发展战略 。但也有非常不同的网络模拟的直觉惊人的例子,比如语音和自然语言 。
由于这种多样性,我看到AlphaGo本身不是一个革命性的突破,而是作为一个极其重要的发展前沿:建立系统,可以捕捉的直觉和学会识别模式的能力 。此前计算机科学家们已经做了几十年,没有取得长足的进展 。但现在,神经网络的成功已经大大扩大,我们可以利用电脑攻击范围内的潜在问题 。
事实上,目前现有的神经网络的理解能力是非常差的 。神经网络很容易被愚弄 。用神经网络识别图像是一个不错的手段 。但是实验证明,通过对图像进行细微的改动,就可以愚弄图像 。例如,下面的图像左边的图是原始图 , 研究人员对中间的图像进行了微小的调整后,神经网络就无法区分了 , 就将原图显示了出来 。
【AlphaGo的神奇全靠它,详解人工神经网络!】另一个限制是 , 现有的系统往往需要许多模型来学习 。例如 , AlphaGo从150000场对战来学习 。这是一个很庞大额度数字!很多情况下,显然无法提供如此庞大的模型案例 。

推荐阅读