人工智能,就好像第四次工业革命,正从学术界的私藏,转变为一种能够改变世界的力量 。尤其,以深度学习取得的进步为显著标志 。它让匍匐前进60年的人工智能一鸣惊人 。
我们正降落到一片新大陆 。深度学习带来的这场重大技术革命,有可能颠覆过去20年互联网对技术的认知,实现技术体验的跨越式发展 。
那么,深度学习到底是什么?怎么理解它的重要性?我们先从概念和现象入手 。
我总结了一句话,学术上看未必严谨,但从我的理解角度看——深度学习是基于多层神经网络的,海量数据为输入的,规则自学习方法 。
这里包含了几个关键词:
第一个关键词叫多层神经网络 。
深度学习所基于的多层神经网络并非新鲜事物,甚至在80年代被认为没前途 。但近年来,科学家们对多层神经网络的不断算法优化,使它出现了突破性的进展 。
以往很多算法是线性的 。而这世界上大多数事情的特征是复杂非线性的 。比如猫的图像中,就包含了颜色、形态、五官、光线等各种信息 。深度学习的关键就是通过多层非线性映射将这些因素成功分开 。
那为什么要深呢?多层神经网络比浅层的好处在哪儿呢?
简单说,就是可以减少参数 。因为它重复利用中间层的计算单元 。我们还是以认猫为例好了 。它可以学习猫的分层特征:最底层从原始像素开始学习,刻画局部的边缘和纹;中层把各种边缘进行组合,描述不同类型的猫的器官;最高层描述的是整个猫的全局特征 。
它需要超强的计算能力,同时还不断有海量数据的输入 。特别是在信息表示和特征设计方面,过去大量依赖人工,严重影响有效性和通用性 。深度学习则彻底颠覆了“人造特征”的范式,开启了数据驱动的“表示学习”范式——由数据自提取特征,计算机自己发现规则,进行自学习 。
你可以理解为——过去,人们对经验的利用,靠人类自己完成 。在深度学习呢?经验,以数据形式存在 。因此,深度学习,就是关于在计算机上从数据中产生模型的算法,即深度学习算法 。
问题来了,几年前讲大数据,以及各种算法,与深度学习有什么区别呢?
过去的算法模式,数学上叫线性,x和y的关系是对应的,它是一种函数体现的映射 。但这种算法在海量数据面前遇到了瓶颈 。国际上著名的ImageNet图像分类大赛,用传统算法,识别错误率一直降不下去,上深度学习后,错误率大幅降低 。在2010年,获胜的系统只能正确标记72%的图片;到2012年,多伦多大学的 Geoff Hinton利用深度学习的新技术,带领团队实现了85%的准确率 。2015年的ImageNet竞赛上,一个深度学习系统以96%的准确率第一次超过了人类(人类平均有95%的准确率) 。
计算机认图的能力,已经超过了人 。尤其图像和语音等复杂应用,深度学习技术取得了优越的性能 。为什么呢?其实就是思路的革新 。
举几个脑洞大开的例子 。
(1)
先说计算机认猫 。
我们通常能用很多属性描述一个事物 。其中有些属性可能很关键,很有用,另一些属性可能没什么用 。我们就将属性被称为特征 。特征辨识,就是一个数据处理的过程 。
传统算法认猫,也是标注各种特征去认 。就是大眼睛,有胡子,有花纹 。但这种特征写着写着,有的猫和老虎就分不出来,狗和猫也分不出来 。这种方法叫——人制定规则,机器学习这种规则 。
深度学习方法怎么办呢?直接给你百万张图片,说这里有猫,再给你上百万张图,说这里没猫 。然后再训练一个深度网络,通过深度学习自己去学猫的特征,计算机就知道了,谁是猫 。
推荐阅读
- 张国立演的高书记是什么电视剧
- 芒果坏了是什么味道,芒果干坏了是什么样
- 什么颜色混合成白色,青色是什么颜色和什么颜色混合而成的?
- 吃过最好吃的零食是什么
- 钣喷是什么,汽车钣金喷漆是什么意思啊
- 艾草青团的馅有什么,春季网红美食【艾草青团】的做法是什么?
- 动车后补票是什么,动车票候补车票是什么意思?
- 胡麻油是什么
- 野馄炖是什么,青岛启动专项整治行动,野烧烤、野馄饨严禁上街, 你怎么看?
- 鲈鱼为什么会发黄,鲈鱼肚子里黄色的两团是什么?