Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ふわっと理解する類似画像検索技術
Search
TajimaTheMemer
April 17, 2019
Programming
0
160
ふわっと理解する類似画像検索技術
TajimaTheMemer
April 17, 2019
Tweet
Share
More Decks by TajimaTheMemer
See All by TajimaTheMemer
事業成長を加速させるGoのコード品質改善の取り組み / Code quality improvement for Go language
tajimathememer
5
2.8k
CronJobがschedule通りにJobを生成しない時
tajimathememer
0
1.5k
入門wasm
tajimathememer
0
140
Machine Learning As Software
tajimathememer
0
91
Other Decks in Programming
See All in Programming
JETLS.jl ─ A New Language Server for Julia
abap34
2
470
QAフローを最適化し、品質水準を満たしながらリリースまでの期間を最短化する #RSGT2026
shibayu36
0
1.9k
Vibe codingでおすすめの言語と開発手法
uyuki234
0
170
AI Agent の開発と運用を支える Durable Execution #AgentsInProd
izumin5210
7
1.4k
フロントエンド開発の勘所 -複数事業を経験して見えた判断軸の違い-
heimusu
6
2.4k
AI前提で考えるiOSアプリのモダナイズ設計
yuukiw00w
0
210
Spinner 軸ズレ現象を調べたらレンダリング深淵に飲まれた #レバテックMeetup
bengo4com
1
210
20251212 AI 時代的 Legacy Code 營救術 2025 WebConf
mouson
0
240
Graviton と Nitro と私
maroon1st
0
160
從冷知識到漏洞,你不懂的 Web,駭客懂 - Huli @ WebConf Taiwan 2025
aszx87410
2
3.3k
.NET Conf 2025 の興味のあるセッ ションを復習した / dotnet conf 2025 quick recap for backend engineer
tomohisa
0
110
AI Agent Tool のためのバックエンドアーキテクチャを考える #encraft
izumin5210
6
1.6k
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
115
100k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
210
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
0
1.8k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
It's Worth the Effort
3n
188
29k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
210
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.4k
Color Theory Basics | Prateek | Gurzu
gurzu
0
170
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
1
220
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
280
Transcript
ふわっと理解する 類似画像検索技術 社内
今日話すこと 統計・機械学習の専門的知識を有さない一般的なエ ンジニア向けに雰囲気で類似画像検索技術を理解し てもらう。
今日話さないこと ソースコードの中身 数式は一切使いません
類似画像検索技術 画像データをクエリとしてクエリと類似度の高い画像 データを検索する技術
画像の類似尺度は様々 タッチ・テクスチャーが 似てる 対象・構図が似てる ゴッホの「ひまわり」 ひまわりの写真 ゴッホの「夜のカフェテラス」
画像の類似尺度は様々 タッチ・テクスチャーが似てる 対象・構図が似てる ゴッホの「ひまわり」 ひまわりの写真 ゴッホの「夜のカフェテラス」
画像の類似尺度は様々 タッチ・テクスチャーが似てる 対象・構図が似てる ゴッホの「ひまわり」 ひまわりの写真 ゴッホの「夜のカフェテラス」 今日はこっちの話
類似画像検索技術も様々
… 画像A 画像Aの特徴ベクトル 画像Aの特徴ベクトル 画像Bの特徴ベクトル 画像Cの特徴ベクトル 画像 は画像 よりも画像 に似ている
しかし、ほぼ全ての手法で以下の流れは 共通する もにょもにょ...
今日は機械学習の手法を3つ組み合わせ たやり方を説明します。
具体的な流れ 特徴抽出 次元削減 近傍探索 フェーズ1 フェーズ2 フェーズ3
… 画像A 画像Aの特徴ベクトル 画像Aの特徴ベクトル 画像Bの特徴ベクトル 画像Cの特徴ベクトル 画像 は画像 よりも画像 に似ている
特徴抽出&次元削減 近傍探索 もにょもにょ...
フェーズ 特徴抽出
フェーズ1:特徴抽出 特徴抽出 次元削減 近傍探索 フェーズ1 フェーズ2 フェーズ3
… 画像A 画像Aの特徴ベクトル 画像Aの特徴ベクトル 画像Bの特徴ベクトル 画像Cの特徴ベクトル 画像 は画像 よりも画像 に似ている
特徴抽出&次元削減 近傍探索 もにょもにょ...
特徴抽出とは 推定や分析に有用と思われる情報を,生データから 抽出し,特徴として使えるようにすること 田島 特徴ベクトル ㎝ 特徴抽出
今回は 画像データからの特徴抽出 を使います。 ディープラーニングの手法の一種 空間的相関性のあるデータに強い 画像 音声
による画像分類 猫 入力された画像に写っている一般物体を分類する学習器を にデータを学習させて作成 犬 兎 犬 猫 兎 入力(RGB画像)
入力層 出力層 中間層
による特徴抽出 猫 犬 兎 犬 猫 兎 入力(RGB画像) 入力層 出力層
中間層 学習済み学習器の中間層の出力は一般物体の 視覚認識に基づいた特徴表現 特徴ベクトル
今回は という のアーキテクチャの 一種を クラスの一般物体画像を分類するタ スクで学習させたモデル 学習済みモデル に画 像を入力した時の中間層の出力 次元
を特 徴ベクトルとする
フェーズ :次元削減 特徴抽出 次元削減 近傍探索 フェーズ1 フェーズ2 フェーズ3
… 画像A 画像Aの特徴ベクトル 画像Aの特徴ベクトル 画像Bの特徴ベクトル 画像Cの特徴ベクトル 画像 は画像 よりも画像 に似ている
特徴抽出&次元削減 近傍探索 もにょもにょ...
次元削減 データの意味をできるだけ保ちつつ データの次元を減らすこと
直感的なイメージ 身長[cm] 体重[kg] α 2次元 1次元 データの意味をできるだけ保ちつ つ次元を減らす Aさん Bさん
Cさん Aさん Bさん Cさん
今回は 主成分分析 という手法を使います。 次元→ 次元に圧縮。
なぜ次元削減が必要か フェーズ3 近似最近傍探索をうまく機能させるために は、データの次元数を 次元以下にする必要があ る
フェーズ 近傍探索 特徴抽出 次元削減 近傍探索 フェーズ1 フェーズ2 フェーズ3
… 画像A 画像Aの特徴ベクトル 画像Aの特徴ベクトル 画像Bの特徴ベクトル 画像Cの特徴ベクトル 画像 は画像 よりも画像 に似ている
特徴抽出&次元削減 近傍探索 もにょもにょ...
近傍探索とは 距離空間における最も近い点を探索すること。 今回でいえば、最も近い画像の特徴ベクトルを探索すること。
今回は 高速近似最近傍探索ライブラリ 製 を使用。 ヒューリスティックではあるが、高速
実験
データセット で見つけた映画ポスターのデータセット約4万枚 そのうち約 万枚を使用
クエリ画像と類似度が高い の 映画ポスターの画像を出力してみる
クエリ1 クエリ画像 TOP 1 TOP 2 TOP 3 ※画像の著作権・肖像権を考慮。
クエリ クエリ画像 TOP 1 TOP 2 TOP 3 ※画像の著作権・肖像権を考慮。
クエリ クエリ画像 TOP 1 TOP 2 TOP 3 ※画像の著作権・肖像権を考慮。
おしまい