快速R-CNN在速度方面表现得更好 , 因为它只为整个图像训练一个CNN 。 但是 , 选择性搜索算法仍然需要花费大量时间来生成候选区域 。
因此 , 发现了更快的R-CNN , 它现在是用于基于深度学习的目标检测的规范模型 。 通过插入区域生成网络(RPN)来预测来自特征的区域 , 它用快速神经网络取代慢的选择性搜索算法 。 RPN用于决定“在哪里”以减少整个推理过程的计算要求 。 RPN快速有效地扫描每个位置 , 以评估是否需要在给定区域中进行进一步处理 。 它通过输出k个边界框区域来做到这一点 , 每个区域具有2个分数 , 表示每个位置处目标的概率 。
一旦我们获得了我们的候选区域 , 我们就会直接将它们提供给基本上是快速R-CNN的内容 。 我们添加了一个池化层 , 一些全连接层 , 最后是一个softmax分类层和边界框回归器 。
总而言之 , 更快的R-CNN实现了更好的速度和更高的精度 。 值得注意的是 , 尽管未来的模型在提高检测速度方面做了很多工作 , 但很少有模型能够以更高的优势超越更快的R-CNN 。 换句话说 , 更快的R-CNN可能不是最简单或最快的目标检测方法 , 但它仍然是表现最好的方法之一 。
近年来的主要目标检测趋势已转向更快 , 更有效的检测系统 。 这在诸如You Only Look Once(YOLO) , Single Shot MultiBox Detector(SSD)和基于区域的完全卷积网络(R-FCN)等方法中可见 , 作为在整个图像上共享计算的一种方法 。 因此 , 这些方法将自己与3种R-CNN技术相关联的昂贵子网区分开来 。 这些趋势背后的主要原因是避免让单独的算法孤立地关注各自的子问题 , 因为这通常会增加训练时间并降低网络准确性 。
3--目标跟踪
目标跟踪指的是在给定场景下跟踪特定感兴趣的一个或者多个目标 。 传统上 , 它应用在视频和现实世界的交互中 , 它们在初始目标检测之后进行观察 。 现在 , 它对自动驾驶系统至关重要 , 例如优步和特斯拉等公司的自动驾驶车辆 。
目标跟踪方法可以根据观察模型分为两类:生成方法和判别方法 。 生成方法使用生成模型来描述表观特征并最小化重建误差以搜索目标 , 例如PCA 。 判别方法可用于区分目标和背景 , 其性能更加鲁棒 , 它逐渐成为跟踪的主要方法 。 判别方法也称为检测跟踪 , 深度学习属于这一类 。 为了通过检测实现跟踪 , 我们检测所有帧的候选目标 , 并使用深度学习从候选者中识别所需目标 。 可以使用两种基本网络模型:栈式自动编码器(SAE)和卷积神经网络(CNN) 。
使用SAE跟踪任务的最流行的深度网络是深度学习跟踪器 , 它提出了离线预训练和在线微调网络 。 这个过程是这样的:
离线无监督预训练使用大规模自然图像数据集的栈式去噪自动编码器以获得一般目标表示 。 通过在输入图像中添加噪声并重建原始图像 , 栈式 去噪自动编码器可以获得更鲁棒的特征表达能力 。
将预训练网络的编码部分与分类器组合以获得分类网络 , 然后使用从初始帧获得的正样本和负样本来微调网络 , 这可以区分当前目标和背景 。 DLT使用粒子滤波器作为运动模型来产生当前帧的候选补丁 。 分类网络输出这些补丁的概率分数 , 表示其分类的置信度 , 然后选择这些补丁中最高的补丁作为目标 。
在模型更新中 , DLT使用限制阈值的方式 。
由于其在图像分类和目标检测方面的优越性 , CNN已成为计算机视觉和视觉跟踪的主流深度模型 。 一般而言 , 大规模CNN既可以作为分类器也可以作为跟踪器进行训练 。 2个代表性的基于CNN的跟踪算法是 完全卷积网络跟踪器(FCNT)和多域CNN (MD Net) 。
推荐阅读
- 黄河颂主要内容 黄河颂主要内容概括
- 家用路由器应放在哪个位置最好?这些小贴士需了解
- 新iPhone日本上市 日本网友:这么贵能卖出去?
- 初一作文涅槃之划破天际
- 小伙不是来参加比赛,是来搞笑的么?这些个弯转的我猝不及防啊!
- 用这个方法做出来的汽水脑洞有点大,一般人不要轻易尝试!
- 天冷手机掉电快,原来是这个原因
- 专家告诉你5G手机为啥这么费电
- 重拾古筝梦600字作文
- 一件难忘的事初一作文