論文紹介 距離学習

【論文簡易紹介】SphereFace: Deep Hypersphere Embedding for Face Recognition

論文紹介

濫読した論文の概要をメモしています。

斜め読みした情報を記載しているため、誤りを含んでいる可能性があります。
誤りを見つけていただいた場合は修正いたしますのでコメント等いただければ幸いです。

メタ情報

論文・学会誌CVPR2017
発行日2017年4月26日
リンクhttps://arxiv.org/pdf/1704.08063.pdf

要約

  • 超級平面上でのなす角を最小化する Angular Softmax Loss を提案
  • Angular Softmax Loss の利用+ 正解にマージン距離を与えながら学習を行う SphereFace を提案
  • LFW, YTF, MegaFace データセットにおいて SOTA な精度を達成
softmax loss, modified softmax loss, angular softmax loss の比較(論文より引用)

先行研究と比較した優位性

従来の手法では、CNN + Softmax Loss によって得た特徴量をユークリッド空間上へと写像し、「同一クラス内の距離を近づける」、「異なるクラスとの距離を離す」ように学習が行われていた。

しかし、Softmax Loss によって得られる特徴量は本質的には角度分布に従っているため、ユークリッド距離を最小化していく手法は適していない可能性があると本論文では主張している。

そこで、特徴同士の「ユークリッド空間上の距離」ではなく「超球平面上のなす角」を学習の対象にする Angular Softmax Loss を提案し、より精緻に「同一クラスの距離を近づける」、「異なるクラスの距離を離す」ような学習が可能になった。

また、マージンと呼ばれる概念を導入しており、学習時は本来よりもマージン分だけ厳しく決定境界が定義されるため、同一クラス内の距離をより近づけることに成功している。

学習・評価

画像の特徴抽出器として ResNet を利用。

学習には CASIAWebFace 0.49M 枚を利用。

評価には LFW, YTF, MegaFace データセットを利用。

MegaFace データセットの精度比較(論文より引用)

関連論文

所感

特徴空間での距離をユークリッド距離ではなく、超球平面上の角度で定義する SphereFace を読みました。

Center Loss(ユークリッド距離を用いた、本論文提出時点で SOTA な手法)と比べて(MegaFace に対しての)精度向上が大きい点、後続の論文である ArcFace, CoSFace でも超球平面上の角度を利用している点から見ても、一つのブレイクスルーが起きた論文と言って良さそうです。

また、論文の導入部分で顔認識タスクについて丁寧に説明がされているため顔認識について学び始める際の導入としても優れているように感じました。

本日は以上です。ここまでご覧いただきありがとうございました。

コメント

タイトルとURLをコピーしました