物体検出 論文紹介

【論文簡易紹介】Focal Loss for Dense Object Detection

物体検出

濫読した論文の概要をメモしています。

精読していないため、誤りを含んでいる可能性があります。
なお、誤りを見つけた場合は修正いたしますのでコメント等いただければ幸いです。

メタ情報

論文・学会誌ICCV 2017
発行日2017年8月7日
リンクhttps://arxiv.org/pdf/1708.02002.pdf

要約

  • 正解クラス間のアンバランスさを解消するための新たな損失関数 focal loss を提案
  • MSCOCO に対して mAP 40.8% を達成
  • 1-stage の手法で 2-stage の手法と同レベルの精度を達成

先行研究と比較した優位性

既存の 1-stage の手法は Anchor と呼ばれる標準の矩形候補を大量に保持しており矩形の候補を変形させることで物体の領域を検出するものがほとんどだった。

この手法ではほとんど全ての矩形候補の正解が「背景」クラスになってしまうため、何らかの物体があることを示すクラスに対する学習が不十分になりやすい課題があった。

既存の手法では「背景」クラスの正解は全体のうち一部しか利用しない等のサンプリング(hard negative sampling)を行うことで学習に不要な正解を除外していたが、サンプリングの割合は人手で設計する必要があり非効率であった。

本論文ではこの課題に対して、簡単に背景と分かる矩形に対する損失を小さくする新たな損失関数 focal loss を提案している。

学習・評価に利用したデータセット

学習、評価ともに MSCOCO データセットを利用。

関連論文

所感

クラス間の不均衡を解消する focal loss が提案された Retina Net についてメモしました。

2017 年の論文ですが2020 年現在でも Anchor ベースの 1-stage 手法 + focal loss はデファクトスタンダード的に利用されており、貢献の大きい論文と言ってもよいのではないでしょうか。

実活用を考えた場合は特に、特定のクラスだけたくさん画像があって他のクラスはほとんどない、というような状況は頻繁に発生することが予想できますので、クラス間の不均衡をある程度吸収してくれる loss は今後も汎用的に使われそうですね。

以上です。
ここまでご覧いただきありがとうございました。

コメント

タイトルとURLをコピーしました