一文看懂计算机视觉,计算机视觉技术

什么是计算机视觉?

一文看懂计算机视觉,计算机视觉技术


【一文看懂计算机视觉,计算机视觉技术】机器视觉是最常用的人工智能应用之一 , 比较好的介绍可以看维基百科 。https://en.wikipedia.org/wiki/Computer_vision计算机视觉(Computer Vision)就是利用计算机来处理图像 , 获得我们想要的信息 。在人工智能领域 , 计算机视觉的含义则更近一步 , 不再是简单的获取图像和对图像进行简单的处理 , 如裁剪、缩放、滤波等 , 而是如何像人一样理解图像 。
这一领域的先驱可追溯到更早的时候 , 但是直到20世纪70年代后期 , 当计算机的性能提高到足以处理诸如图像这样的大规模数据时 , 计算机视觉才得到了正式的关注和发展 。比如下面这张图 , 在人的眼里 , 能很容易识别出一个男人、斑马线、黑色的背包、手机等等 , 同时还可以理解到这些物体之间的关系 , 一个背着黑色背包的男人正打着电话在过斑马线 。
甚至还可以进行进一步的推理 , 如根据这个男人的着装 , 那么他可能是一个喜欢运动的人 。但是在计算机的眼里则是从0到255的数字(像素的范围) , 对于彩色图像 , 还有三个通道 。那么我们如何让机器也能同人一样能够识别和理解蕴含在图中语义信息 , 这就是计算机视觉要做的事情 。计算机视觉的目前主要包括:最基础的如物体的检测和识别 , 在此基础上的动作姿态识别 , 物体跟踪 , 图像修复和增强等 。
更进一步的则是图像理解的研究 。比如下面这张图 , 首先需要识别出来图中存在的所有的物体 , 给他们标签 。比如左图中 , 识别出来大象(elephant)、河流(river)等等 , 甚至包括描述性的信息如脏(dirty)、躺(laying) , 站立(standing)等 。再对这些标签进行语义上的重组 , 构成一句话 。而该图中仍然存在不少问题 , 如识别出了图中不存在的物体如马、人等 。

    推荐阅读