AI已经可以学会看主播视频,来教自己打游戏了


AI已经可以学会看主播视频,来教自己打游戏了



AI已经可以学会看主播视频,来教自己打游戏了




我训练了谁,谁又训练了我?
今年6月底,知名科技公司OpenAI发布了一篇论文,主要围绕着一项名为 “视频预训练”(VPT:Video PreTraining)的AI技术展开讨论 。
这项研究的成果相当喜人,例如,在看了7万多个小时《我的世界》视频后,案例中的AI已经成功学会了求生所需的大部分必备技能:游泳、狩猎、建房、下矿,甚至搜刮村庄 。
尽管依然存在着一些人类难以理解的操作,但就结果来说,这已经比许多同类AI表现得要好多了 。
AI已经可以学会看主播视频,来教自己打游戏了




AI搜到东西后兴奋地撸起了天花板
当然,相比起背后堆积如山的代码与“逆动力模型”等看了就让人迷茫的技术词汇,作为普通玩家的我们,更关心的可能还是这么一款高智能、饶有趣味的AI到底什么时候才能实装进游戏里 。
AI已经可以学会看主播视频,来教自己打游戏了




“给俺也整一个”
1
无须等待,AI走进千万家的场景就在当下 。
虽然OpenAI的模型目前仅提交给了专门负责研究《我的世界》AI的MineRL大赛,但就在他们论文发布的前后几天,另一个功能类似的AI也同样出现在了网上 。更重要的是,研究团队直接将他们的代码放在了Github上供所有人下载研究 。
AI已经可以学会看主播视频,来教自己打游戏了




MineDojo的Github页面
这个名叫MineDojo的项目由英伟达的工程师进行开发,同样是通过观看网上的视频资料进行训练,但与OpenAI略有不同的是,他们的资料库要庞大得多 。
【AI已经可以学会看主播视频,来教自己打游戏了】MineDojo一共搜集了73万个油管上的游戏视频、7000多个维基网页,甚至还有上百万条和《我的世界》有关的Reddit评论 。
AI已经可以学会看主播视频,来教自己打游戏了




“互联网规模”
这么做的目的,当然在于帮助AI理解人类语境中“建造“”求生“等词汇的意义,油管主们在教学视频中声情并茂地教导观众从哪里出发,到哪里寻找神庙,再到如何攻略末影龙——
对于AI来说,这就是上好的“网课” 。
支持这一行为的,是一个被称为MineCLIP的学习算法 。它可以帮助AI把主播的解说与视频中展示的操作联系起来,以此达到训练的目的;同样的,训练好的AI也能理解玩家直接下达的任务 。
这是MineDojo最有趣的部分,工程师们准备了3000个可以直接下达给AI的指令,一类是程序化任务,例如“生存3天”或“收集两块木头”,这是可以用数字和名词客观衡量的任务;另一类是抽象化任务,例如“建造一座漂亮的海滨别墅” 。
AI可能很难理解“漂亮”“海滨”“别墅”到底是什么意思,不过通过视频画面的讲解,再搜索玩家们相关评论的关键词之后,大多数时刻AI都能有模有样地完成目标 。
在这些任务中,玩家可以给AI下令“把牛羊圈起来”“去沼泽里找鸡”“尽可能地活久一点”,或者干脆让它去搜刮一个海底神庙 。因为使用了互联网上的常用语言,AI对某些人类特有的幽默感学得挺到位的 。
AI已经可以学会看主播视频,来教自己打游戏了




下达”玩”的指令
和OpenAI的模型比起来,MineDojo的技术难度或许并没有那么高,毕竟它直接接入了游戏端口,利用游戏内的数据直接控制AI行动要简单许多;而OpenAI则是从零开始建立了一个模仿人类的行动模型,指令都是直接模拟人类的键鼠操作 。

推荐阅读