Open AI用强化学习算法 教会机械手“盘核桃”


Open AI用强化学习算法 教会机械手“盘核桃”



【Open AI用强化学习算法 教会机械手“盘核桃”】据国外媒体报道 , 由马斯克创办的非盈利性人工智能组织Open AI近日展示了一项新的研究成果:让机械手像人手一样精准地操纵物体 。
这套名为Dactyl的机械手系统能够按照指令要求 , 轻松完成转动立方体的动作 , 像人手“盘核桃”一样灵活 。 它之所以能实现如此复杂精妙的指尖操作 , 和Open AI使用的强化学习算法有关系 。 他们让机器在虚拟环境中自我学习 , 在训练过程中增加大量随机事件 , 让AI在这个过程中自己领悟出完成任务的诀窍 。 首先 , 他们会教导机械手按照指令 , 将六面立方体中的正确颜色翻转出来;然后开始改变周围环境的灯光 , 以及立方体的颜色、重量和纹理等;甚至还会改变训练过程中的重力环境因素 。 这种虚拟环境的训练模式不会耗费现实世界的时间 。 目前Dactyl已积累了大约100年的训练经验 , 但这个过程只相当于现实世界中的50小时 。

    推荐阅读