DeepMind,deepmind( 二 )


DeepMind持续亏损之后 , 我们得考虑一下AI真的是未来吗?

DeepMind,deepmind


DeepMind是世界上前沿的人工智能研究机构 。在过去三年里 , DeepMind的亏损超过了10亿美元 。未来一年 , 还将偿还超过10亿美元的债务 。但这并不意味着人工智能正在崩析!研究是要花钱的 , DeepMind每年都在做更多的研究 。投入的资金是巨大的 , 可能比以往任何人工智能项目的投入都要多 , 但与科学领域一些规模最大的项目所花费的资金相比 , 还远远算不上史无前例 。
大型强子对撞机每年耗资约10亿美元 , 而发现希格斯玻色子的总成本据估计超过100亿美元 。当然 , 真正的机器智能(也被称为通用人工智能)的价值远不止这些 , 它可以驱动一台像《星际迷航》(Star trek)那样的计算机 , 能够分析用普通英语提出的各种问题 。尽管如此 , DeepMind不断攀升的亏损规模还是值得深思的:2016年亏损1.54亿美元 , 2017年亏损3.41亿美元 , 2018年亏损5.72亿美元 。
在我看来 , 有三个核心问题:DeepMind是否走在科学的正轨上?从Alphabet的角度来看 , 这种规模的投资是否合理?这些损失又将如何影响人工智能? 关于第一个问题 , 我们是有理由怀疑的 。DeepMind将大部分鸡蛋放在一个篮子里 , 这种技术被称为深度强化学习 。该技术将主要用于识别模式的深度学习与强化学习相结合 , 基于奖励信号进行学习 , 例如游戏中的分数或象棋等游戏中的胜利或失败 。
2013年 , DeepMind在一篇论文中给这项技术取了名字 , 该论文展示了如何训练单个神经网络系统来玩Atari游戏 , 比如《Breakout》和《Space Invaders》 , 与人类的水平相当 , 甚至比人类玩得还要好 。这篇论文是一篇工程杰作 , 可能是2014年1月DeepMind出售给谷歌的关键催化剂 。
这种技术的发展推动了DeepMind在围棋和电脑游戏《StarCraft)》中取得了令人印象深刻的胜利 。问题是 , 这种技术非常受限于于特定的环境 。例如 , 在玩Breakout时 , 微小的变化就会导致性能急剧下降(比如将paddle up移动几个像素) 。DeepMind星际争霸的结果同样受到限制 , 当在单个地图上玩具有单一“种族”角色的时 , 结果优于人类 , 但在不同地图和不同角色上的结果较差 。
如果要切换角色 , 则需要重新训练系统 。在某些方面 , 深度强化学习是一种涡轮增压记忆; 使用它的系统能够提供很棒的功能 , 但是他们对自己的工作理解很浅 。因此 , 当前的系统缺乏灵活性 , 无法在世界发生变化时进行相应的变化 , 甚至是微小的变化也不行 。(DeepMind最近关于肾病的研究结果也受到了类似的质疑)深度强化学习也需要大量的数据 。
例如:数以百万计与自己对战的围棋游戏数据 。这远远超过了一个人想要在围棋上成为世界级棋手所需要的数据水平 , 而且通常会非常困难或昂贵 , 往往需要谷歌规模的计算资源 。这意味着 , 在许多实际问题中 , 仅计算一项对于大多数用户来说就太过昂 。据估计 , AlphaGo的训练时间花费了3500万美元;同样的训练将消耗的能量与12760个连续三天不睡觉的人脑消耗的能量相同 。
但这只是经济学 。正如我和欧内斯特?戴维斯(Ernest Davis)在即将出版的新书《重启人工智能》(Rebooting AI)中所说:“真正的问题在于信任” 。目前 , 深度强化学习只能在控制良好、很少出现意外的环境中进行;这对于在2000年规则都没有改变的围棋游戏来说是可行的 , 但是在许多实际情况中却不可以 。

推荐阅读