学了后面忘前面,治疗AI“健忘症”还难有良策


学了后面忘前面,治疗AI“健忘症”还难有良策



很多人在上学的时候都有这样的经历 , 在经过了一个寒假返校后 , 发现前一学期学到的内容有的已经忘了 。 在见识过人工智能PK人类的屡屡胜绩后 , 有人不免羡慕AI强大的学习本领 , 但事实上人工智能的“记性”并不如你想象的那样好 , 如果你像人工智能系统那样学习 , 很可能在学习新知识的同时 , 大脑便会逐渐忘了之前的内容 , 其原因就在于人工智能遭遇了“灾难性遗忘” 。
近日 , 来自谷歌大脑的最新研究发现 , 在街机学习环境的由多个子任务组成的单任务场景中也存在着“灾难性遗忘” 。 特别像在“蒙特祖玛复仇”这种探索型游戏里 , 场景变化较大 , 会出现学习完当前游戏场景后 , 忘记上一个游戏场景知识的情况 。
那么人工智能为什么会产生“灾难性遗忘”?目前解决“灾难性遗忘”的方案有哪些?难点在哪?就此 , 科技日报采访人员采访了有关专家 。
学一个忘一个 深度学习效率低下
自从阿尔法围棋(AlphaGo)相继战胜多名围棋冠军后 , 深度学习已经成为众多实现人工智能的方法中最耀眼的“明星” , 也是各大研发机构角逐的主战场 。 而谷歌大脑团队这次面临的“灾难性遗忘” , 正是人工智能深度学习中所面临的一个普遍且严重的问题 。
“‘灾难性遗忘’指的是人工智能系统 , 如深度学习模型 , 在学习新任务或适应新环境时 , 忘记或丧失了以前习得的一些能力 。 ”腾讯人工智能实验室副主任俞栋博士在接受科技日报采访人员采访时说 , “灾难性遗忘”会造成人工智能系统在原有任务或环境中的性能大幅下降 。
美亚柏科信息中心总经理魏朝东介绍 , 在深度神经网络学习不同任务的时候 , 相关权重的快速变化会损害先前任务的表现 , 通俗来说 , 就是在学习中像猴子搬苞谷 , 捡一个丢一个 , 记住了新知识 , 也有可能会忘掉了老知识 。
【学了后面忘前面,治疗AI“健忘症”还难有良策】正是源于此 , “灾难性遗忘”的存在 , 一定程度上限制了人工智能在一些场景中的应用 。
福州大学数学与计算机科学学院、福建省新媒体行业技术开发基地副主任柯逍博士举例说 , 如一个AI图像识别系统 , 当需要添加一个新的类别的物体时 , 就不得不把原先的所有物体都再学习一次 。 如在文物鉴定系统中 , 当有一天发现原始数据中有一个文物朝代错了 , 便没办法单独对这一个错误的文物进行修改学习;再如让AI系统学习英语之后 , 再让它学习德语 , 它可能会把原来学习的英语语法全部忘光 。
那么在谷歌大脑的最新研究中 , “灾难性遗忘”又造成了哪些影响?其中又有何新发现?
“除了传统的新知识学习会覆盖旧知识之外 , 这次谷歌大脑还发现 , 在如‘超级玛丽’等探索型游戏里 , ‘灾难性遗忘’会阻碍模型对新知识的学习 。 ”厦门大学科技处副处长、人工智能系教授纪荣嵘说 。
纪荣嵘进一步解释说 , 面向街机游戏学习的强化学习方法都会采用“经验回放”的训练方式 , 就是将模型在游戏探索时候的片段进行保存 , 然后给模型进行“回放”训练 。 而像“蒙特祖玛复仇”这种游戏 , 游戏场景变化比较大 , 模型需要不间断探索游戏场景 , 因此 , 在训练时候就必须不断回放早期场景的游戏经验 , 不然会因为“灾难性遗忘”而忘记了早期的游戏知识 。
“这也导致了新的游戏经验虽然能够被采样到‘经验回放’库里 , 但因为学习方式的设定 , 导致学习效率低 , 同时由于不同阶段的学习会互相干扰 , 使得AI无法一次通过该游戏的全部关卡 。 ”纪荣嵘说 。

推荐阅读