物体検出 論文紹介

【論文簡易紹介】Feature Pyramid Networks for Object Detection

物体検出

濫読した論文の概要をメモしています。

精読していないため、誤りを含んでいる可能性があります。
なお、誤りを見つけた場合は修正いたしますのでコメント等いただければ幸いです。

メタ情報

論文・学会誌CVPR2017
発行日2016年12月9日
リンクhttps://arxiv.org/pdf/1612.03144.pdf

要約

  • FCN の中間出力を利用して認識を行う Feature Pyramid Network を提案
  • MSCOCO 2016 challenge 優勝
  • MSCOCO データセットに対して 33.9mAP を達成
Feature Pyramid Network とそれに関連するネットワークのアーキテクチャ(論文より引用)

先行研究と比較した優位性

物体認識における一般的な課題として、様々なスケールの物体を検出しづらいことが挙げられる。

この解決策として提案されている手法はいくつかあるが、それぞれ問題を抱えている。

上記に記載した (a) のように画像の解像度を変更して複数回認識を実行する方法は複数の認識モデルが必要になるため学習・認識にかかるコストが高い。

(b) のように FCN(Fully Convolutional Network)から抽出された特徴マップを認識に利用する手法は特徴マップのサイズが小さいため、一つの特徴が見ている画像の領域が広くなってしまい小さい物体の認識精度が低い。(Faster R-CNN, YOLO がこれに該当する)

(c) のように多段の特徴マップをそれぞれを認識に利用する手法は小さい物体にある程度対応できる特徴マップの特徴抽出が不十分であるため、やはり小さい物体の認識精度が低い。(SSD がこれに該当する)

提案手法 (d) は FCN によって抽出した特徴マップをアップサンプリングしながら中間特徴マップに結合していくため、小さい物体の認識精度が向上する。

学習・評価に利用したデータセット

学習・評価ともに MSCOCO データセットを利用。

関連論文

所感

小さい物体の検出精度を向上させた、 2017年の Feature Pyramid Network を読みました。

2020年現在もなお、FPN ベースの手法は研究が盛んに行われており、FPN に U-Net と Attention 機構を持たせた 『M2Det (2018)』、 FPN の結合を NAS(Neural Architecture Search) によって最適化する 『NAS-FPN (2019)』、重み付き双方向 FPN を提案している 『EfficientDet (2019)』 などが代表的でそれぞれ MSCOCO に対する SOTA を更新しています。

FPN が汎用的で優れたアイディアであったことは間違いないことかと思いますが、物体検出においてはスケールの異なる(がクラスが同一な)物体を適切に検出することが大きな課題として捉えられており、その解決を今もなお目指していることがわかりますね。

以上です。
ここまでご覧いただきありがとうございました。

コメント

タイトルとURLをコピーしました