Open AI用强化学习算法 教会机械手“盘核桃”

【Open AI用强化学习算法 教会机械手“盘核桃”】

Open AI用强化学习算法 教会机械手“盘核桃”



据国外媒体报道, 由马斯克创办的非盈利性人工智能组织Open AI近日展示了一项新的研究成果:让机械手像人手一样精准地操纵物体 。
这套名为Dactyl的机械手系统能够按照指令要求, 轻松完成转动立方体的动作, 像人手“盘核桃”一样灵活 。 它之所以能实现如此复杂精妙的指尖操作, 和Open AI使用的强化学习算法有关系 。 他们让机器在虚拟环境中自我学习, 在训练过程中增加大量随机事件, 让AI在这个过程中自己领悟出完成任务的诀窍 。 首先, 他们会教导机械手按照指令, 将六面立方体中的正确颜色翻转出来;然后开始改变周围环境的灯光, 以及立方体的颜色、重量和纹理等;甚至还会改变训练过程中的重力环境因素 。 这种虚拟环境的训练模式不会耗费现实世界的时间 。 目前Dactyl已积累了大约100年的训练经验, 但这个过程只相当于现实世界中的50小时 。

    推荐阅读