比围棋还复杂的星际争霸,AI怎么玩?


比围棋还复杂的星际争霸,AI怎么玩?



围棋AI华丽落幕 , 巨头转战星际争霸AI 。 游戏一直是衡量人工智能水平的重要指标 。
近日 , 实时战略游戏AI比赛中的重磅竞赛——2018 AIIDE国际星际争霸人工智能竞赛结果出炉 。 全球27支团队在12台计算机上大战两个星期 , 每个机器人大约参与了2600场比赛 , 每两个机器人之间打了100场比赛 , 总计3万多局车轮战后 , 前三甲花落韩国三星的SAIDA、美国Facebook的Cherry Pi以及我国中科院自动化研究所的CSE 。
去年 , 制作Alpha Go的公司谷歌 DeepMind宣布 , 他们接下来会把星际争霸作为研究平台 。 同年 , Facebook AI实验室也开始研发星际争霸AI 。 巨头缘何迷上1998年就诞生的经典即时战略游戏——星际争霸?
硬编码夺魁 , 但还不敌专业玩家
星际争霸AI大赛由来已久 。 2010年起每年举办一次 , 主办方是纽芬兰纪念大学的大卫·丘吉尔 , 赞助方是谷歌 DeepMind、Facebook等多家中外知名机构 。 AI机器人在《星际争霸:母巢之战》游戏中互相厮杀 , 最终比赛结果按照整体胜率排序 。
【比围棋还复杂的星际争霸,AI怎么玩?】季军团队张俊格教授介绍 , AIIDE规定 , 参赛机器人通过BWAPI访问游戏 , 每个参赛选手无法通过任何途径作弊 。 比赛开启战争迷雾 , 尽量接近人与人对战的真实情况 。 参赛机器人的运行速度不可超时 , 否则被判为输掉比赛 。
“成为第一个打赢人类职业选手的机器人!”胸怀伟大梦想的韩国三星机器人SAIDA夺魁 , 该团队尝试过机器学习技术 , 但最终采用非机器学习的硬编码技术 。 张俊格介绍 , 三星公司曾经拥有星际争霸职业战队 , 在获取专家知识上存在优势 , 去年通过内部编程竞赛决出最优异员工 , 今年1月开始打造SAIDA , 目标直指世界冠军 。
去年 , 傲视群雄的独立业余玩家占参赛选手的一半 , 今年却罕见身影 。 原来 , 第二名Cherry Pi背后的机构Facebook AI实验室 , 聘请了去年竞赛排前几名的若干顶级作者到他们团队 。
中科院自动化所智能系统与工程研究中心开发的CSE获得季军 。 该中心为自动化所独立建制的科研部门 , 致力于研究博弈对抗与自主进化智能 , 包括感知智能与认知决策智能 。
“当前AI玩游戏的主要研究方向是深度强化学习算法 。 ”张俊格表示 , 这类算法还能用在机器人、自动驾驶领域 , “从长远来看 , 它更是通往通用人工智能的重要基础 。 ”未来逐渐成熟的AI技术 , 将在制造、金融、物流等诸多行业得到重要应用 。
难度远胜围棋 , AI看不清的迷局
AI玩星际争霸比下围棋复杂在哪儿?简单来说 , 谷歌DeepMind的阿尔法狗即使在围棋领域战胜世界冠军柯洁 , 在星际争霸领域也暂时没有任何对外公开的成果 。 张俊格表示 , 衡量一个游戏的复杂性主要取决于观测空间、动作空间以及是否能观测到全部信息 。 “从这个角度 , 《星际争霸》远超围棋复杂度 。 ”
观测空间上 , 星际争霸观测的是整个屏幕中显示游戏内容的区域 , 以及小地图上的区域 , 每个像素都是观测空间的一部分 , 每个像素又蕴含很多信息 , 如是否在战争迷雾范围内、当前时间点哪个兵种或建筑覆盖了哪个像素 。 围棋的观测空间只有棋盘361个摆放棋子的位置 , 每个位置只有黑子、白子、无子三种状态 。
动作空间上 , 星际争霸的鼠标可在屏幕任意位置点击、框选 , 并对框选单位执行复杂操作 。 围棋只能在棋盘上没有棋子的线与线交叉的点上放棋子 。

推荐阅读