Abstract


논문에서는 mobile, embedde 환경을 위한 효율적인 모델 MobileNets을 제시합니다. MobileNets은 경량화된 nets을 만들기위해서 depthwise separable convolution을 기반으로 합니다.

저자들은 2가지 global hyper parameter를 도입했습니다. 이 hypter parameter들은 모델을 설계할 때, 각 환경에 따라 적합한 사이즈의 모델을 설계할 수 있도록 합니다.

논문에서 다양한 실험을 통해서 ImageNet classification 에서 유명한 모델들과 비교해서 MobileNets의 성능이 우수함을 보여줍니다. 그리고 MobileNets의 효율성이 다양한 분야에서 적용될 수 있음을 보여줍니다.

Introduction


AlexNet이후로 CNN은 computer vision에서 활발하게 사용되었습니다. 일반적인 트렌드는 더 깊고 복잡한 nets를 만들어서 높은 정확도를 얻어내는 것입니다. 하지만 정확도 향상을 이러한 방식이 nets의 사이즈와 속도에 대한 효율성을 만드는 것은 아닙니다. 실제 환경에서는 제한된 플랫폼에서 적절한 시간안에 모델이 작동될 필요가 있습니다.

논문에서는 mobile, embedde 환경에 맞게, 아주 작고 빠른 모델을 설계하기위한 효율적인 nets 구조와 2가지 hypter parameter를 제안합니다.

MobileNet Architecture


먼저 Depthwise separable filter에 대해 설명한 후, 2가지 shrinking hyper parameter(width multiplier, resolution multiplier)에 대해 설명하겠습니다.