alphago,aiphago( 三 )


在这两者配合之下,至少部分人就拥有了不依赖老师,而自己学习新知识甚至开拓新领域的能力 。而AlphaGoZero并非一无所有,它有两大神经网络架构,供它从每一局的自对弈中提取分析胜败的特征算法,即自我反省能力,自我总结能力,并且将这种反省和总结立即投入到下一局的实战中进行校验的能力 。而之所以能只通过490万局自对弈就能胜过从前三千万局的成果,我想这主要是因为算法的改进,尤其是特征提取方面的改进造成的,要知道从前的AlpahGo的一些基础特征,比如虎口之类的认知靠的是外界输入设定的,这说明老版本的特征提取能力不强,当然在能够利用人类经验的情况下,许多棋型特征都可以作为先验知识输入,这样在初期显示出来的水平较高,但在后期则可能受制于这些权重较高的经验而误入歧途 。
这就是为何阿尔法元的成功,证明了两件事 。其一,围棋是可以完全从零开始进行AI化的游戏,其二,人类经验在一定程度上是有局限的,会限制AI在极高水平时候的提高和成长 。但我们还是得看到,阿尔法元 vs Master版本时候,并未到达全胜,总还是给人类经验留下点颜面了 。另外,看到阿尔法元的成长史,也颇为有趣,万丈高楼也得有个地基啊 。
AlphaGo Zero凭借完全自学击败AlphaGo是否意味着人工智能已经可以开始独立思考?
AlphaGoZero并不会独立思考 。目前还没有看到其把完虐老弟AlphaGo的喜悦或者谦虚的情感分享出来的具体行为,可能更不会想到人类看到其优秀表现而可能形成对其自己不利的现状,进而也就说明AlphaGoZero并没有形成类似我们人类的自我概念 。没有独立自我概念,谈什么独立思考 。不过,当提及独立思考的时候,我们并不知道这个独立的思考的具体过程和含义,独立思考是一个抽象的描述,可以代表很多事情 。
例如,看到蛇,我们本能的就会跑掉,该过程反应极快,但也经过了大脑的判断,只不过这个过程感觉起来有些机械化 。当我们为做错的事情感到羞愧并且努力改变的时候,会被认为是一个独立思考的过程,不过造成羞愧和努力的动机到底源自哪里,很难说清楚,可以理解成是自我的趋势,也可以理解成某些化学物质的作用 。总之,当我们还不能彻彻底底的描述独立思考的时候,独立思考有利于解释很多事情,但其并没有实际的意义 。
AlphaGoZero独立思考的更具体描述应该是独立学习,也是介绍AlphaGoZero的文章当中提及的重要部分 。这种独立学习的能力如果延展出去,会给很多研究带来突破,不光是下棋 。回想牛顿定律、爱因斯坦相对论,这些伟人是如何在数据及其有限的情况下搞出这些定律的,如果从已经有自我概念的思考方式来看,可以把原因归于其有一个更好的大脑,更好的基因,这样没有发现这些定律的人会好受很多,减少沮丧 。
可是从学习的角度来讲,他们之所以有伟大的发明,可能是他们更善于学习,有着更好的思维方式 。那么,如果人工智能能够独立学习,并且借助永不停止工作模式,和指数级增长的性能,有助于找出更多类似牛顿定律这样的发现,那么我们人类将会极大的收益 。目前很多科学家都在研究和人类一样的机器大脑,有两种方式:一种是赋予机器和人类一样的学习能力,另外一种是把人脑的模型复制到机器当中 。
从AlphaGoZero这里例子来看,其应该是符合第一种方式 。当然,目前赋予学习能力的这个机器和我们大脑的结构并不完全相同,甚至可以理解成有着类似原理的简化版本,不过这并不妨碍其能够做很多事情,例如自己下棋 。从我们以往的认知来说,AlphaGoZero不具备独立思考的能力;不过从学习的角度来讲,AlphaGoZero貌似已经独立了 。

推荐阅读