Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Metric Learning入門
Search
nishikimi
September 22, 2019
Research
6
4.7k
Metric Learning入門
Metric Learningについて基礎的な内容とArcFaceについて内容をまとめた資料です。
nishikimi
September 22, 2019
Tweet
Share
Other Decks in Research
See All in Research
3D Gaussian Splattingによる高効率な新規視点合成技術とその応用
muskie82
5
2.5k
クラウドのテレメトリーシステム研究動向2025年
yuukit
3
950
SSII2025 [TS2] リモートセンシング画像処理の最前線
ssii
PRO
7
2.8k
Vision And Languageモデルにおける異なるドメインでの継続事前学習が性能に与える影響の検証 / YANS2024
sansan_randd
1
100
ノンパラメトリック分布表現を用いた位置尤度場周辺化によるRTK-GNSSの整数アンビギュイティ推定
aoki_nosse
0
320
Adaptive fusion of multi-modal remote sensing data for optimal sub-field crop yield prediction
satai
3
210
20250605_新交通システム推進議連_熊本都市圏「車1割削減、渋滞半減、公共交通2倍」から考える地方都市交通政策
trafficbrain
0
380
EarthMarker: A Visual Prompting Multimodal Large Language Model for Remote Sensing
satai
3
290
Combinatorial Search with Generators
kei18
0
270
Towards a More Efficient Reasoning LLM: AIMO2 Solution Summary and Introduction to Fast-Math Models
analokmaus
2
210
Mathematics in the Age of AI and the 4 Generation University
hachama
0
160
Weekly AI Agents News!
masatoto
33
67k
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
32
5.9k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
228
22k
Gamification - CAS2011
davidbonilla
81
5.3k
How to Think Like a Performance Engineer
csswizardry
24
1.7k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
A designer walks into a library…
pauljervisheath
206
24k
Facilitating Awesome Meetings
lara
54
6.4k
Writing Fast Ruby
sferik
628
61k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.5k
Side Projects
sachag
455
42k
Transcript
Metric Learning入門 2019/9/25 Rev0
本資料の位置づけ ❏ 読者の想定: Deep LearningでCNNによる画像分類の知識があるが、 Metric Learningに関する知識がない方 ❏ 最終的には、原論文を読んで欲しいですが、 基礎となる情報をスライドにまとめました。
❏ 資料は今後修正&更新していく予定です。
解こうとしているタスク 犬 人 猫 Aさん Bさん Cさん 一般物体認識 (通常の画像分類) 特徴
1クラスあたりのデータ数が少ない より詳細な物体認識 (通常の画像分類) 過学習を起こしやすい
metric learningの全体像 特徴量抽出器 (モデル) 学習時 利用時 ①同じクラスは 距離が近くなるように 学習 *実際には、n次元のベクトルです
②距離(類似度)を算出 検索したい データ
metric learningの全体像 特徴量抽出器 (モデル) 学習時 利用時 ①同じクラスは 距離が近くなるように 学習 *実際には、n次元のベクトルです
②距離(類似度)を算出 検索したい データ 学習時には 1クラス複数枚の 画像が必要 利用時には 1クラス1枚の画像でも よい
metric learningの種類 siamese network triplet network L2 softmax network 発表年
2006年〜 2014年〜 2017年〜 入力形式 2つペアを入力 3つペアを入力 ペア無しで入力 モデルの 概要 ancher
L2 softmax networkの代表的なモデル ・CosFace ・SphereFace ・ArcFace ・AdaCos
ArcFace (列ごとに)正規化 正規化 ① を とみなす ②正解ラベルに対する のみ mのペナルティを与える ① ②
③ ③logitsの値が小さいので logitをs倍する
Toyデータでの結果
None
メリット・デメリット ・通常のクラス分類のモデルに拡張する形なので実装が容易 ・クラス数が多いとパラメータ数が多くなる。 ・(学習時になかった)新しいクラスのデータに対する 予測精度が低い メリット デメリット
ArcFaceのクラス化 ・正規化 ・arcCos ・+mのペナルティ ・s倍のスケール などの一連の処理をクラス化 https://github.com/4uiiurz1/pytorch-adacos
通常の分類モデル の後にmetricモデルの 処理をつなげる インスタンス化
活用できそうなケース ・商品検索 - 例:自動販売機のジュース、コンビニにあるタバコ - 新商品が発売されても、画像が1枚あれば対応可能 ・レコメンド(ランキング) - 例:洋服のECサイトで選択した商品に似たアイテムを表示
参考リンク ・Metric Learning 入門 https://copypaste-ds.hatenablog.com/entry/2019/03/01/164155 ・モダンな深層距離学習 (deep metric learning) 手法:
SphereFace, CosFace, ArcFace https://qiita.com/yu4u/items/078054dfb5592cbb80cc ・ArcFaceの論文 https://arxiv.org/abs/1801.07698 ・Pytorchの実装コード https://github.com/4uiiurz1/pytorch-adacos