正如冯·诺伊曼(von Neumann)所描述的那样:“现实生活由‘虚张声势’‘欺骗的小策略’‘问问自己别人会认为我打算做什么’组成 。”
图|DeepNash(蓝色)在与人类(红色)的对阵中表现出“虚张声势” 。正面虚张声势(A);负面虚张声势(B);DeepNash 将一个斥候伪装成一个间谍 , 并获得情报(C) 。(来源:该论文)
研究团队表示,这项工作引入了一种新的博弈论方法,与最先进的基于搜索的学习方法截然不同 , 在训练过程中不执行任何形式的搜索或显式对手建模,只依赖于在测试时使用一些游戏特定的启发式教学 。
展望未来 , 目前还没有迹象表明 R-NaD 在零和的双人游戏设定之外会如何发展 。【陆军棋的规则和玩法怎么放图片 陆军棋的规则和玩法】
然而,研究团队却认为,它或许可以解锁深度学习方法在现实世界中具有不完全信息特征的巨大空间的多智能体问题中的进一步应用 。例如 , 最先进的双人扑克方法已经成功应用在六人扑克中 。
该方法在这类不完全信息场景下或许有很多潜在应用,包括人群和交通建模、智能电网、拍卖设计和市场问题等 。
参考链接:www.science.org/doi/10.1126/science.add4679来源:学术头条
推荐阅读
- 军棋玩法规则
- 顺丰陆运比普通快递快吗
- Word自动编号问题,认识编号新大陆
- 中国陆军军衔等级肩章排列图片 陆军军衔等级肩章排列图片
- 如何登陆192.168.1.1
- 抖音为什么看不到别人的评论,用别的号登陆却可以看到 抖音为什么看不到别人的评论
- 斗罗大陆小舞和不乐是哪一集的 斗罗大陆小舞和不乐是哪一集
- 上instagram用哪个加速器 怎么登陆instagram
- 苹果手机如何登陆两个微信 苹果手机怎么登录2个微信
- 苹果如何登陆两个微信 苹果如何登陆两个微信和qq