物体検出 論文紹介

【論文簡易紹介】M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network

物体検出

濫読した論文の概要をメモしています。

斜め読みした情報を記載しているため、誤りを含んでいる可能性があります。
誤りを見つけていただいた場合は修正いたしますのでコメント等いただければ幸いです。

メタ情報

論文・学会誌AAAI2019
発行日2018年11月12日
リンクhttps://arxiv.org/pdf/1811.04533.pdf

要約

  • FPN の複数特徴を合成することでマルチレベルな特徴を抽出可能な物体検出器 M2Detを提案
  • MSCOCO データセットにおいて 1-stage 手法の SOTA な精度となる 41.0 mAP を達成
M2Det のアーキテクチャ(論文より引用)

先行研究と比較した優位性

マルチスケールな物体を検出するために FPN(Feature Pyramid Network)を利用して特徴を抽出する手法が数多く提案されていたが、多くの手法はピラミッドの層それぞれを独立した検出器として利用していた。

しかし、ピラミッドの層は特定の解像度の情報しか持っていないため、複雑な特徴を抽出し切れていなかった。

提案手法ではピラミッドの各層から得た特徴を合成する FFM(Feature Fusion Module)、複数スケールの特徴を抽出する TUM(Thinned U-Shape Module)、抽出した複数スケールの特徴を結合する SFAM(Scale-wise Future Aggregation Module)を利用することで様々なスケールの物体を効率よく検出する MLFPN (Multi-Level Feature Pyramid Network)している。

学習・評価

学習には MSCOCO2017 trainval135k を、評価には MSCOCO2017 test-dev を利用。

各ベンチマーク手法、バックボーンに利用したモデル、入力サイズごとの精度は下表の通り。

M2Det とその他の手法の精度比較(論文より引用)

関連論文

所感

MLFPN を提案した M2Det の論文を読みました。

ResNet + SSD + FPN + U-Net + SE-Module と様々な技術を盛り込んだネットワークになっています。

なお、 MLFPN は非常に複雑な構造を持っていますが 1-stage 手法の中でも非常に高速に動作します。

本日は以上です。ここまでご覧いただきありがとうございました。

コメント

タイトルとURLをコピーしました