Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Convolutional Neural NetworkとRankNetを用いた画像の順序予測
Search
sz_dr
October 19, 2016
Technology
0
210
Convolutional Neural NetworkとRankNetを用いた画像の順序予測
TokyoTech LT (2016/10/19)で発表した資料です
sz_dr
October 19, 2016
Tweet
Share
More Decks by sz_dr
See All by sz_dr
Vespaを利用したテクいベクトル検索
szdr
3
230
ヤフーにおける機械学習検索ランキングの取り組み
szdr
11
15k
RecSys 2019 論文読み会 発表資料
szdr
1
1.1k
E-Commerce検索におけるランキング研究
szdr
1
790
ランク学習と偽負例化合物を用いたバーチャルスクリーニング
szdr
0
430
Other Decks in Technology
See All in Technology
これはPerl? それともRuby? クイズ〜〜〜〜〜!!!- Perl or Ruby Quiz
moznion
3
2.1k
【完全版】Dify - LINE Bot連携 考え方と実用テクニック
uezo
2
780
Castor - Le Task Runner PHP qui simplifie votre Workflow
lyrixx
1
340
YAPC::Hakodateの映像記録を支える技術
godan
4
400
クレジットカードを製造する技術
yutadayo
83
50k
Unlearn Modularity
lemiorhan
6
220
Qdrant を用いた検索改善施策の紹介 / Search Engineering Tech Talk 2024 Summer
visional_engineering_and_design
2
260
I tried the newly introduced certification "Applied Skills" on Microsoft Learn
mappie_kochi
0
280
外部カンファレンスで登壇しよう! 〜「強い」エンジニアへの一歩を踏み出す〜
logica0419
4
110
Grafana エコシステムの活用事例 on ABEMA
tetsuya28
4
660
いまいまMySQL2024 @ OSC Nagaoka
sakaik
2
170
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
5
48k
Featured
See All Featured
Making Projects Easy
brettharned
115
5.9k
GraphQLの誤解/rethinking-graphql
sonatard
65
9.9k
Facilitating Awesome Meetings
lara
49
6k
Robots, Beer and Maslow
schacon
PRO
157
8.2k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
327
21k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
664
120k
Agile that works and the tools we love
rasmusluckow
327
21k
Bootstrapping a Software Product
garrettdimon
PRO
304
110k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
48k
A better future with KSS
kneath
237
17k
Faster Mobile Websites
deanohume
304
30k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
26
670
Transcript
東京工業大学 大学院情報理工学研究科 計算工学専攻 秋山研究室 鈴木 翔吾 Convolutional Neural Networkと RankNetを用いた画像の順序予測
TokyoTech LT 2016/10/19
お前誰よ? 2 鈴木翔吾 / Shogo D. Suzuki @sz_dr • 東京工業大学
大学院情報理工学研究科 計算工学専攻 秋山研究室 • ケモインフォマティクス・機械学習 • メインはPython,たまにC++
今日のお話 3 ♥ 研究でやってること A B C A ≻ B
≻ C A ≻ C ≻ B 化合物 タンパク質 機械学習で順序を予測
今日のお話 4 ♥ 研究でやってること A B C A ≻ B
≻ C A ≻ C ≻ B 化合物 タンパク質 機械学習で順序を予測 今日お話すること A B C 画像 ♥ @sz_dr A ≻ B ≻ C A ≻ C ≻ B 機械学習で順序を予測
アイデア 5 好み関数 0.9 画像 スコア これが求まると嬉しい 0.5 0.6 0.9
≺ ≺ スコアでソートした結果
好み関数のモデル化 6 好み関数 0.9 画像 スコア (RGB, W, H) =
(3, 80, 80) Convolutional Neural Network : ℝ1×2×3 → ℝ 画像認識の分野で広く用いられているモデル [LeCun+ 98] ※話すと長くなる部分なので, 知らない方は各自調べてみてください
好み関数の最適化 7 好み関数 : ℝ1×2×3 → ℝ @sz_drの好みを反映するように 好み関数のパラメータを学習する 訓練データ
: 9 : 8 ⋮ : 1 損失関数 を最小化するように学習 (Rank Net) ※ と を近づけていくイメージ 好み関数がAをBよりも高く ランク付けする確率 好み関数による画像A, Bの予測スコア Aの方が好きなとき1 Bの方が好きなとき0 同じくらい好きなとき0.5 [Burges+ 05]
学習の流れ 8 Lantisちゃんねるから『TVアニメ「ラブライブ!」先行発表PV』を取得 OpenCVを用いて 顔部分をクリッピング (277枚の顔画像を生成) 各画像にスコアを割り当て(つらい) 9 8 7
6 5 4 3 2 1 Chainer(Deep Learningフレームワーク)を用いて学習
訓練データの予測結果 9 好み関数を正しく学習できているか確認 9 8 7 6 5 4 3
2 1
訓練データの予測結果 10 好み関数を正しく学習できているか確認 9 8 7 6 5 4 3
2 1
テストデータの予測 11 訓練データ : 9 : 8 ⋮ : 1
テストデータ 『ラブライブ!』 『ラブライブ!サンシャイン!!』 ※訓練データにテストデータの画像は含まれていないことに注意
テストデータの予測 12 @sz_drによる好み順序 訓練 データ テスト データ
テストデータの予測 13 @sz_drによる好み順序 CNN+RankNetによる予測結果 訓練 データ テスト データ
テストデータの予測 14 CNN+RankNetによる予測結果 ☺ 似ている画像は同じような順位にきている ☹ 予測結果は正しい好み順序をあまり反映していない (訓練データとテストデータで順序傾向が異なるため?)
まとめ 15 やったこと Convolutional Neural NetworkとRankNetを用いた画像の順序予測 応用先は? 漫画の表紙買いとか…広告画像の最適化とか…?? できてないこと •
訓練データを集めるのが大変 (人手による評価が必要) • 評価値のバラエティの考慮 (9段階も必要…?Excellent・Good・Badくらいで良い??) • CNNでは見た目しか考慮できない (キャラクターの性格等をどうやって考慮する…??)