Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Grad-CAMの始まりのお話
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Shintaro Yoshida
October 25, 2020
Research
98
0
Share
Grad-CAMの始まりのお話
EAGLYS株式会社 AI 勉強会第4回の資料になります。
Grad-CAMの実装とそのアイデアの元となったCAMやGuided-Back-Propagationについて説明しています。
Shintaro Yoshida
October 25, 2020
More Decks by Shintaro Yoshida
See All by Shintaro Yoshida
顔認証・顔識別周りのサーベイ
shintaro202020
7
53
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
shintaro202020
4
250
The Origin of Grad-CAM
shintaro202020
0
150
Other Decks in Research
See All in Research
Dwangoでの漫画データ活用〜漫画理解と動画作成〜@コミック工学シンポジウム2025
kzmssk
0
200
離散凸解析に基づく予測付き離散最適化手法 (IBIS '25)
taihei_oki
PRO
1
740
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
1k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
200
Grounding Text Complexity Control in Defined Linguistic Difficulty [Keynote@*SEM2025]
yukiar
0
150
存立危機事態の再検討
jimboken
0
260
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
110
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
770
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
900
学習型データ構造:機械学習を内包する新しいデータ構造の設計と解析
matsui_528
6
4.5k
台湾モデルに学ぶ詐欺広告対策:市民参加の必要性
dd2030
0
290
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
2.8k
Featured
See All Featured
How to train your dragon (web standard)
notwaldorf
97
6.6k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.6k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
Paper Plane
katiecoart
PRO
1
49k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
200
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.6k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
490
Discover your Explorer Soul
emna__ayadi
2
1.1k
Between Models and Reality
mayunak
3
260
Transcript
Grad-CAMの 始まりの話 AI勉強会#4 @Eaglys on 2020/10/25 吉田 慎太郎 @sht_47
Grad-CAMの特徴 • Grad-CAM(Gradient-weighted Class Activation Mapping, 2016, Ramprasaath) ◦ XAIで最も有名なもの(理由はGrad-CAMのページで説明)
◦ CAM(2015, Zhou) の弱点を克服し、全てのCNNモデルに対して一般化 • XAI(Explainable Artificial Intelligence) の目的 (筆者の長期的な視点) 失敗の原因を特定 (モデル << 人間) 予測の根拠を説明し、判定の信頼⬆ (モデル ≒ 人間) 人間がAIに教わる (モデル >> 人間)
今回の勉強会で扱う内容 - Grad-CAMのアイデアになった論文たち - - - - Grad-CAMのモデル中身 - 実験結果
- Google Colaboratoryでの実装
NIN(Network In Network, 2014 Lin et al) - 偉大な論文 (2つのメインアイデア)
計算量削減のために1x1 Convを導入 ( InceptionNetのアイデアの源、ResNet Botttleneck Block) GAP(Global Average Pooling) を提案 → 最近だとAdaptive Average Pooling • GAP Structural Regularizerとして機能 ◦ Feature MapとCategory間の関係がより自然に ◦ 追加のParameterが不要 ◦ Spatial TranslationにRobust
Object Detectors Emerge In Deep Scene Cnns(2015 Zhou et al)
- Scene Recognitionの問題を解く → Object Detector が出現した Objectの正解ラベルを与えていないのに。。。 先行研究として、Object Classification問題のCNNで、Object Localizationの出現 Places Database (2014 Zhou et al )
CAM(Class Activation Mapping 2015 Zhou et al) … … Final
Conv GAP FC k枚 k個 … c個 a a 1 を用いて CAMを生成
CAM(Class Activation Mapping) … … Final Conv GAP FC 4096枚
4096個 … 1000個 VGG16 (ImageNet) 7 7
CAMの数式と概念図 iとjでSum Kで Sum それぞれのプロセスは独立 Zは最終Feature Mapのサイズ(今回は49)
CAMの使用方法(推論時に利用) Iとjで 平均 Kで 加重平均 (Image Source : Zhou et
al 2015) CAM Kで 加重平均 推論 CAM生成
Guided Back-Propagation(2015 Springenberg) - Deconvolutional Network (2011 Zeiler) Max Poolingの反対の操作
- Guided Backprop deconvNetを ReLUのBackPropagationに組み合わせ
Guided-Backpropの実験結果 Batch Size : 64 Learning Rate : 0.01 Weight
Decay : 0.001 Optimizer : SGD Conv6 Conv9
Grad-CAM(2016 Ramprasaath) CAMはGAPに限定 → 一般化( 全てのCNN Architectureで可能) CAM(Corase)とGuided-Backprop(Fined-Grained)を組み合わせ CAMにReLUを挿入(Positiveな影響を与えるもののみ必要) CAM,
Grad-CAM共にArchitectural ChangeやRe-Trainが必要ない iとjでSum Kで 加重平均 Kで 加重平均
Grad-CAMの結果1 - Microsoft COCO データセット - Validation Dataset からSample -
Ice Creamで誤り
Grad-CAMの結果2 VGG@ImageNetにおける間違い集 モデルがバイアスを含むかどうか
実装 - Pytorch 1.6 https://github.com/sht47/grad-cam-Pytorch1.6 - Tensorflow 2.3 https://github.com/sht47/grad-cam-Tensorflow2.3