Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Metric Learning入門
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
nishikimi
September 22, 2019
Research
4.7k
6
Share
Metric Learning入門
Metric Learningについて基礎的な内容とArcFaceについて内容をまとめた資料です。
nishikimi
September 22, 2019
Other Decks in Research
See All in Research
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
610
2026年1月の生成AI領域の重要リリース&トピック解説
kajikent
0
980
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
930
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
490
AIを叩き台として、 「検証」から「共創」へと進化するリサーチ
mela_dayo
0
250
LLM Compute Infrastructure Overview
karakurist
2
1.2k
2026 東京科学大 情報通信系 研究室紹介 (大岡山)
icttitech
0
2.7k
LOSの検討(λ Kansai 2026 in Winter)
motopu
0
120
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
840
R&Dチームを起ち上げる
shibuiwilliam
1
240
論文紹介 "ReSim: Reliable World Simulation for Autonomous Driving"
kogo
0
490
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.6k
Featured
See All Featured
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
130
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
Six Lessons from altMBA
skipperchong
29
4.2k
Between Models and Reality
mayunak
3
280
The Art of Programming - Codeland 2020
erikaheidi
57
14k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.8k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
550
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.5k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
160
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
270
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
410
Building Applications with DynamoDB
mza
96
7k
Transcript
Metric Learning入門 2019/9/25 Rev0
本資料の位置づけ ❏ 読者の想定: Deep LearningでCNNによる画像分類の知識があるが、 Metric Learningに関する知識がない方 ❏ 最終的には、原論文を読んで欲しいですが、 基礎となる情報をスライドにまとめました。
❏ 資料は今後修正&更新していく予定です。
解こうとしているタスク 犬 人 猫 Aさん Bさん Cさん 一般物体認識 (通常の画像分類) 特徴
1クラスあたりのデータ数が少ない より詳細な物体認識 (通常の画像分類) 過学習を起こしやすい
metric learningの全体像 特徴量抽出器 (モデル) 学習時 利用時 ①同じクラスは 距離が近くなるように 学習 *実際には、n次元のベクトルです
②距離(類似度)を算出 検索したい データ
metric learningの全体像 特徴量抽出器 (モデル) 学習時 利用時 ①同じクラスは 距離が近くなるように 学習 *実際には、n次元のベクトルです
②距離(類似度)を算出 検索したい データ 学習時には 1クラス複数枚の 画像が必要 利用時には 1クラス1枚の画像でも よい
metric learningの種類 siamese network triplet network L2 softmax network 発表年
2006年〜 2014年〜 2017年〜 入力形式 2つペアを入力 3つペアを入力 ペア無しで入力 モデルの 概要 ancher
L2 softmax networkの代表的なモデル ・CosFace ・SphereFace ・ArcFace ・AdaCos
ArcFace (列ごとに)正規化 正規化 ① を とみなす ②正解ラベルに対する のみ mのペナルティを与える ① ②
③ ③logitsの値が小さいので logitをs倍する
Toyデータでの結果
None
メリット・デメリット ・通常のクラス分類のモデルに拡張する形なので実装が容易 ・クラス数が多いとパラメータ数が多くなる。 ・(学習時になかった)新しいクラスのデータに対する 予測精度が低い メリット デメリット
ArcFaceのクラス化 ・正規化 ・arcCos ・+mのペナルティ ・s倍のスケール などの一連の処理をクラス化 https://github.com/4uiiurz1/pytorch-adacos
通常の分類モデル の後にmetricモデルの 処理をつなげる インスタンス化
活用できそうなケース ・商品検索 - 例:自動販売機のジュース、コンビニにあるタバコ - 新商品が発売されても、画像が1枚あれば対応可能 ・レコメンド(ランキング) - 例:洋服のECサイトで選択した商品に似たアイテムを表示
参考リンク ・Metric Learning 入門 https://copypaste-ds.hatenablog.com/entry/2019/03/01/164155 ・モダンな深層距離学習 (deep metric learning) 手法:
SphereFace, CosFace, ArcFace https://qiita.com/yu4u/items/078054dfb5592cbb80cc ・ArcFaceの論文 https://arxiv.org/abs/1801.07698 ・Pytorchの実装コード https://github.com/4uiiurz1/pytorch-adacos