物体検出 論文紹介

【論文簡易紹介】NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

物体検出

濫読した論文の概要をメモしています。

精読していないため、誤りを含んでいる可能性があります。
なお、誤りを見つけた場合は修正いたしますのでコメント等いただければ幸いです。

メタ情報

学会・論文誌CVPR 2019
発行日2019年4月16日
論文リンクhttps://arxiv.org/pdf/1904.07392.pdf

要約

  • NAS を利用して FPN の経路を最適化した NAS-FPN を提案
  • MSCOCO に対し、Mask-RCNN を上回る精度である 48.3 mAP を達成
  • バックボーンや FPN の構成は Retina Net と同様
NAS-FPN のアーキテクチャ(論文より引用)

先行研究と比較した優位性

従来の手法(Retina Net)は 多段 CNN より得た複数の特徴マップを結合する FPN と呼ばれる手法を利用していた。

しかし、特徴同士をどう結合するかを人手で判断していたため、最適化されていない可能性があった。

この論文では 特徴マップ結合の設計を NAS に任せる NAS-FPN を採用しているため、より優れた特徴マップの結合経路が設計されている。

学習・評価に利用したデータセット

学習、評価ともに MSCOCO 2017 を利用。

関連論文

所感

Retina Net の FPN 部分に NAS を利用した手法を提案しています。2019 年の比較的新しい論文ですね。

Retina Net に対する優位性は NAS を利用している点のみなので FPN の設計においても NAS が効果的であることが示されたと言えるかと思います。

NAS を使えば精度が上がるかのようにも読めますが、実際には「選択可能な行動そのものは人手で設計する必要がある(囲碁のように選択可能な行動が完全に制限されていない)」ため、どのようなコネクションやオペレーションを許容するかは依然として人の手で考える必要があり、この部分には難しさが残ります。

また、あくまでパラメータ探索を強化学習で最適化していると捉えるのが正しく、抜本的に新しいアーキテクチャが開発されることはないことにも注意が必要です。

もはや NAS の解説になってしまいましたが今回は以上になります。

ここまでご覧いただき、ありがとうございました。

コメント

タイトルとURLをコピーしました