误把光头当足球 AI视力差不仅仅因为训练少( 二 )


黄铁军认为,表面上看,这次AI摄像机出现失误可能是因为前期训练不够,但最主要的原因是现在的计算机识别系统还只是用特定的数据训练出来的,例如在上述例子中,使用大量足球视频训练的神经网络在识别足球方面已超越人类,但却忽视了这个网络对光头更敏感,对
没见过的对象胡乱识别或“视而不见”,这种问题普遍存在 。
机器视觉就是将视觉感知赋予机器,使机器具有和生物视觉系统类似的场景感知能力,涉及到光学成像、图像处理、分析与识别、执行等多个组成部分 。
“把摄像机作为AI的‘眼睛’,在现实场景中,让AI像人眼一样去识别足球和光头,还有很长的路要走 。 ”黄铁军表示 。
什么时候能走完这条路,甚至实现AI之眼超越人眼?
这取决于机器视觉何时弥合与生物视觉的差距 。 “颅骨之中的大脑通过三百多万根神经纤维实时感知外部世界,其中每只眼睛后面就有一百多万根 。 ”黄铁军表示,“发展至今天的机器视觉,与花费亿万年进化而来的生物视觉系统相比,还是小巫见大巫 。 ”
人眼适应性很强,能在复杂及变化的环境中识别目标,具有高级智能,能运用逻辑分析、推理能力去识别变化中的目标,并总结规律 。 而反观机器视觉,虽然可以利用人工智能神经网络技术,但不能很好识别变化的目标,受硬件条件制约,目前一般的图像采集系统色彩分辨能力较差 。
“与生物视觉神经网络相比,人工智能的视觉神经网络在结构、规模上相距甚远,所以功能也要差很多 。 ”黄铁军表示,“在现实应用中,机器视觉‘翻车’不是偶然事件,把光头识别成足球,只是个案,类似问题其实大量存在 。 ”
黄铁军说:“这一次,技术提供方可以把光头误认为足球的漏洞补上,但还有更多的漏洞,用对抗性图片训练骗过人脸识别系统只是揭开机器视觉不足的冰山一角 。 ”
不同技术路线在赛跑
“基于深度学习的机器视觉在图像识别等方面取得重大进展,但并未真正解决感知问题 。 ”黄铁军认为,深度学习远未抓住人类视觉系统的复杂性 。
深度学习建立在图像和视频大数据的训练基础上,和主动感知动态世界的生物视觉相距甚远,而且仍未脱离算力需求 。 例如,如果把视频帧率从30提高到3万,深度学习的算力就需要提高1000倍 。
而生物神经网络是脉冲神经网络,更适合完成视觉信息处理 。 黄铁军认为,借鉴生物视觉系统的神经网络结构和信息加工机理,建立一套新的类脑视觉信息处理理论和技术,是重启机器视觉的希望所在 。
专家表示,发展人工机器视觉,目前有两条主要技术路线,一是通过收集更多数据、增加数据量,加大训练力度,构造出强大的智能系统;二是模仿生物神经系统,照葫芦画瓢,将生物神经系统的结构甚至机理搞清楚,以此为基础发展未来智能 。
黄铁军认为,第二条路径要比第一条路径更有效 。 “短时间来看,第一条更易取得成果 。 但长远来看,从生物神经网络入手更为直接,实现目标也更有把握 。 ”
目前,AI学界多数支持第一条路径,即通过“大数据 大算力”的方式,发展机器视觉在内的人工智能 。 黄铁军踏上少数人走的那条路,是因为他坚信生物视觉神经网络有巨大潜能可以挖掘 。 “生物大脑是亿万年进化的产物,是最好的先验结构 。 强大智能必须依托复杂结构,站在进化肩膀上,看似艰难,实则最快 。 ”
“计算机科学之父”图灵早就表达过对生物大脑的推崇 。 1943年初,香农提议,可以把“文化的东西”灌输给电子大脑,图灵有一次在大庭广众之下反驳:“不,我对建造一颗强大的大脑不感兴趣,我想要的不过是一颗寻常的大脑,跟美国电报电话公司董事长的脑袋瓜差不多即可 。 ”

推荐阅读