【ChamNet】2019-CVPR-ChamNet: Towards Efficient Network Design through Platform-Aware Model Adaptation

ChamNet

2019-CVPR-ChamNet: Towards Efficient Network Design through Platform-Aware Model Adaptation

来源: ChenBong 博客园

Introduction

基于2个平台上的latency对input/output channel敏感性的观察, 认为需要做platform-aware的结构搜索

使用3个predictor(Acc, Latency, Energy), 在已有的backbone网络(MBV2, ResNet)的基础上, 根据目标平台的需求(Latency, Energy) 快速调整block的配置(channel, expand ration, depth), 得到满足要求的高性能网络结构, 再经过retrain后部署

不同平台上, Acc-Latency/Energy 的 sota tradeoff

Motivation

  • flops只是计算开销(Latency/Energy)的proxy, FLOPs与具体设备上的开销不一定成正比
image-20210613154550943
  • 不同的硬件平台对不同宽度的网络有不同的优化,导致FLOPs上细微的差距, 在Latency上有很大的差距 e.g. (32,32) vs (33,33)
  • 不同的硬件平台, 对输入/输出通道的敏感度也不同

Contribution

Method

3个predictor

Accuracy Predictor

高斯过程GP

image-20210613155214720

Latency Predictor

构建目标平台上每个opration 的 Look up table, 再求和得到完整网络在目标平台的Latency预测值

image-20210613155406025

Energy Predictor

高斯过程GP

Energy计算方式:

  • 使用power monitor代替电池, monitor保持4.2V恒压, 每隔200μm监测一次电流
  • 让手机保持18s的空闲状态(计算空闲电流)
  • 网络前向1000次 Q=UIt=4.2Vx(运行电流-空闲电流)x时间
image-20210613155430163

Experiments

MobileNet V2

image-20210613155555817

Acc-Latency trade-off

image-20210613155717495 image-20210613155706124

Acc-Energy trade-off

image-20210613155810571

ResNet

image-20210613155624710

Acc-Latency trade-off

image-20210613155645801 image-20210613155654362

ChamNet-Mobile的FLOPs与Latency的分布

image-20210613160804526

FLOPs与Latency的分布不成正比, 相关性也不大

Conclusion

Summary

  • 方法很常规, 直接以Latency/Energy为目标搜索, 落地的价值比较高, (Facebook App上的3D照片)
  • 不同平台对输入输出通道的敏感性的观察很有意思

To Read

Reference

Facebook 新研究:使用CNN将任何2D照片转换为3D (qq.com)

Facebook新研究:只需1秒,2D照片也能模拟3D效果 (qq.com)

Facebook将照片3D化技术商用,强大的算法+海量的数据+移动端优化是工程亮点 (qq.com)

原文地址:https://www.cnblogs.com/chenbong/p/14888606.html