机器之心发布
机器之心编辑部
PP-LCNet 在同样精度的情况下,速度远超当前所有的骨架网络,最多可以有 2 倍的性能优势!
算法速度优化遇到瓶颈,达不到要求?应用环境没有高性能硬件只有 CPU?
是不是直接戳中了各位开发者的痛点!莫慌,今天小编就来为万千开发者破局 。
这个破局点就是:针对 CPU 设备及加速库 MKLDNN 定制的骨干网络 PP-LCNet!
空口无凭 , 上图为证!
从上图我们可以看出,PP-LCNet 在同样精度的情况下,速度远超当前所有的骨架网络,最多可以有 2 倍的性能优势!它应用在比如目标检测、语义分割等任务算法上,也可以使原本的网络有大幅度的性能提升 。
而这个 PP-LCNet 的论文发布和代码开源后,也着实引来了众多业界开发者的关注,各界大神把 PP-LCNet 应用在 YOLO 系列算法上也真实带来了极其可观的性能收益 。
这时候是不是有小伙伴已经按耐不住也想直接上手试试了?!
小编识趣地赶紧送上开源代码的传送门 。大家一定要 Star 收藏以免走失,也给开源社区一些认可和鼓励 。
地址:https://github.com/PaddlePaddle/PaddleClas
而这个 PP-LCNet 到底是如何设计,从而有这么好的性能的呢?下面小编就带大家来领略一下:
PP-LCNet 核心技术解读
近年来,很多轻量级的骨干网络问世,各种 NAS 搜索出的网络尤其亮眼 。但这些算法的优化都脱离了产业最常用的 Intel CPU 设备环境,加速能力也往往不合预期 。百度飞桨图像分类套件 PaddleClas 基于这样的产业现状,针对 Intel CPU 及其加速库 MKLDNN 定制了独特的高性能骨干网络 PP-LCNet 。比起其他的轻量级 SOTA 模型 , 该骨干网络可以在不增加推理时间的情况下 , 进一步提升模型的性能 , 最终大幅度超越现有的 SOTA 模型 。
PP-LCNet 的网络结构整体如上图所示 。我们经过大量的实验发现,在基于 Intel CPU 的设备上 , 尤其当启用 MKLDNN 加速库后,很多看似不太耗时的操作反而会增加延时,比如 elementwise-add 操作、split-concat 结构等 。所以最终我们选用了结构尽可能精简、速度尽可能快的 block 组成我们的 BaseNet(类似 MobileNetV1) 。基于 BaseNet,我们通过实验 , 总结出四条几乎不增加延时但又能够提升模型精度的方法,下面将对这四条策略进行详细介绍:
更好的激活函数
自从卷积神经网络使用了 ReLU 激活函数后,网络性能得到了大幅度提升 。近些年 ReLU 激活函数的变体也相继出现,如 Leaky-ReLU、P-ReLU、ELU 等 。2017 年 , 谷歌大脑团队通过搜索的方式得到了 swish 激活函数,该激活函数在轻量级网络上表现优异 。在 2019 年,MobileNetV3 的作者将该激活函数进一步优化为 H-Swish,该激活函数去除了指数运算,速度更快,网络精度几乎不受影响 。我们也经过很多实验发现该激活函数在轻量级网络上有优异的表现 。所以在 PP-LCNet 中,我们选用了该激活函数 。
合适的位置添加 SE 模块
SE 模块是 SENet 提出的一种通道注意力机制 , 可以有效提升模型的精度 。但是在 Intel CPU 端 , 该模块同样会带来较大的延时,如何平衡精度和速度是我们要解决的一个问题 。虽然在 MobileNetV3 等基于 NAS 搜索的网络中对 SE 模块的位置进行了搜索,但是并没有得出一般的结论 。我们通过实验发现,SE 模块越靠近网络的尾部对模型精度的提升越大 。下表也展示了我们的一些实验结果:
推荐阅读
- 环保床垫是什么材料 环保床垫是什么材料组成的
- 梦到买了很多菜 梦到买了很多菜是什么意思
- 梦到苹果梨 梦到苹果梨是什么意思
- 梦到吃青辣椒 梦到吃青辣椒是什么预兆
- 梦到给别人花生 梦到给别人花生是什么意思
- 梦到银耳 梦到银耳是什么意思
- 房子备案价是什么意思 什么是房子备案价
- 梦到卖米 梦到卖米是什么预兆
- 梦到切豆腐 梦到切豆腐块是什么意思
- 孕妇梦到摘红枣 孕妇梦到摘红枣是什么意思