打游戏也输了!新款“阿尔法”击败人类玩家


打游戏也输了!新款“阿尔法”击败人类玩家



【打游戏也输了!新款“阿尔法”击败人类玩家】继围棋“人机大战”成功击败人类顶尖围棋高手后 , 谷歌旗下的人工智能技术公司“深层思维”的人工智能程序“阿尔法星” , 与人类职业选手在经典即时战略电脑游戏《星际争霸2》对战中 , 取得压倒性胜利 。
据“深层思维”公司介绍 , 自去年12月以来 , 该公司开发的“阿尔法星”人工智能程序与高水平人类职业选手先后举行了11场比赛 。 在这一系列“人机大战”中 , 人工智能程序最终以10比1击败人类选手 。 只有在1月24日举行的现场比赛中 , “阿尔法星”由于游戏视角受限 , 人类选手才勉强赢下一场 。
“深层思维”公司联合研发负责人戴维·西尔弗在比赛后指出:“尽管后续还有很多工作要做 , 但是我希望未来人们在回望今天时 , 会把这一比赛结果当成人工智能系统的能力又向前迈了一步的表现 。 ”
据介绍 , 与围棋棋盘上所有棋子都对双方可见不同 , 此类游戏中有“战争迷雾” , 一方需要猜测和侦察对方的行动 , 属于“不完美信息博弈” , 并且要求人工智能必须实时做出反应 , 这对人工智能的要求更高 。
“深层思维”公司表示 , 在“阿尔法星”之前 , 还没有任何人工智能系统能够在《星际争霸2》中能与人类职业选手的技巧比拟 。 而“阿尔法星”能够在这场“人机大战”中大比分胜出的一个重要基础 , 就是它使用了深度神经网络 , 研究人员通过监督学习和强化学习的方式 , 直接利用游戏的原始数据来训练 , 以模仿学习的思路 , 让模型快速学到高水平人类玩家在游戏中使用的策略和操作 。
此外 , 《星际争霸2》等游戏中有一个“手速”的概念 , 用APM(每分钟操作指令数)来衡量 。 在基准测试中 , “阿尔法星”每分钟能够执行约280个操作指令 , 虽然远低于人类职业选手 , 但是其动作更精确 , 也有助于在比赛中取得胜利 。
下赢围棋、打赢电脑游戏 , 这都能给人工智能的发展带来什么呢?“深层思维”的研究团队认为 , 训练“阿尔法星”的先进方法以及算法的先进架构未来都会有助研究人员积累更多经验 , 最终设计出能够应对现实生活中不少复杂问题的人工智能程序 , 比如天气预测、气候模型计算以及语言理解等 。

    推荐阅读