Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Grad-CAMの始まりのお話
Search
Shintaro Yoshida
October 25, 2020
Research
0
77
Grad-CAMの始まりのお話
EAGLYS株式会社 AI 勉強会第4回の資料になります。
Grad-CAMの実装とそのアイデアの元となったCAMやGuided-Back-Propagationについて説明しています。
Shintaro Yoshida
October 25, 2020
Tweet
Share
More Decks by Shintaro Yoshida
See All by Shintaro Yoshida
顔認証・顔識別周りのサーベイ
shintaro202020
0
33
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
shintaro202020
0
200
The Origin of Grad-CAM
shintaro202020
0
99
Other Decks in Research
See All in Research
PetiteSRE_GenAIEraにおけるインフラのあり方観察
ichichi
0
240
論文読み会 KDD2024 | Relevance meets Diversity: A User-Centric Framework for Knowledge Exploration through Recommendations
cocomoff
0
140
データサイエンティストをめぐる環境の違い 2024年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
930
Large Vision Language Model (LVLM) に関する最新知見まとめ (Part 1)
onely7
23
5.4k
テキストマイニングことはじめー基本的な考え方からメディアディスコース研究への応用まで
langstat
1
170
Practical The One Person Framework
asonas
1
1.9k
2038年問題が思ったよりヤバい。検出ツールを作って脅威性評価してみた論文 | Kansai Open Forum 2024
ran350
8
3.7k
博士学位論文予備審査 / Scaling Telemetry Workloads in Cloud Applications: Techniques for Instrumentation, Storage, and Mining
yuukit
1
1.6k
Neural Fieldの紹介
nnchiba
1
550
情報処理学会関西支部2024年度定期講演会「自然言語処理と大規模言語モデルの基礎」
ksudoh
10
2.4k
20241226_くまもと公共交通新時代シンポジウム
trafficbrain
0
310
Weekly AI Agents News!
masatoto
30
45k
Featured
See All Featured
The Pragmatic Product Professional
lauravandoore
32
6.4k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
570
The Illustrated Children's Guide to Kubernetes
chrisshort
48
49k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
49
2.2k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Building Flexible Design Systems
yeseniaperezcruz
328
38k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
Done Done
chrislema
182
16k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
870
Transcript
Grad-CAMの 始まりの話 AI勉強会#4 @Eaglys on 2020/10/25 吉田 慎太郎 @sht_47
Grad-CAMの特徴 • Grad-CAM(Gradient-weighted Class Activation Mapping, 2016, Ramprasaath) ◦ XAIで最も有名なもの(理由はGrad-CAMのページで説明)
◦ CAM(2015, Zhou) の弱点を克服し、全てのCNNモデルに対して一般化 • XAI(Explainable Artificial Intelligence) の目的 (筆者の長期的な視点) 失敗の原因を特定 (モデル << 人間) 予測の根拠を説明し、判定の信頼⬆ (モデル ≒ 人間) 人間がAIに教わる (モデル >> 人間)
今回の勉強会で扱う内容 - Grad-CAMのアイデアになった論文たち - - - - Grad-CAMのモデル中身 - 実験結果
- Google Colaboratoryでの実装
NIN(Network In Network, 2014 Lin et al) - 偉大な論文 (2つのメインアイデア)
計算量削減のために1x1 Convを導入 ( InceptionNetのアイデアの源、ResNet Botttleneck Block) GAP(Global Average Pooling) を提案 → 最近だとAdaptive Average Pooling • GAP Structural Regularizerとして機能 ◦ Feature MapとCategory間の関係がより自然に ◦ 追加のParameterが不要 ◦ Spatial TranslationにRobust
Object Detectors Emerge In Deep Scene Cnns(2015 Zhou et al)
- Scene Recognitionの問題を解く → Object Detector が出現した Objectの正解ラベルを与えていないのに。。。 先行研究として、Object Classification問題のCNNで、Object Localizationの出現 Places Database (2014 Zhou et al )
CAM(Class Activation Mapping 2015 Zhou et al) … … Final
Conv GAP FC k枚 k個 … c個 a a 1 を用いて CAMを生成
CAM(Class Activation Mapping) … … Final Conv GAP FC 4096枚
4096個 … 1000個 VGG16 (ImageNet) 7 7
CAMの数式と概念図 iとjでSum Kで Sum それぞれのプロセスは独立 Zは最終Feature Mapのサイズ(今回は49)
CAMの使用方法(推論時に利用) Iとjで 平均 Kで 加重平均 (Image Source : Zhou et
al 2015) CAM Kで 加重平均 推論 CAM生成
Guided Back-Propagation(2015 Springenberg) - Deconvolutional Network (2011 Zeiler) Max Poolingの反対の操作
- Guided Backprop deconvNetを ReLUのBackPropagationに組み合わせ
Guided-Backpropの実験結果 Batch Size : 64 Learning Rate : 0.01 Weight
Decay : 0.001 Optimizer : SGD Conv6 Conv9
Grad-CAM(2016 Ramprasaath) CAMはGAPに限定 → 一般化( 全てのCNN Architectureで可能) CAM(Corase)とGuided-Backprop(Fined-Grained)を組み合わせ CAMにReLUを挿入(Positiveな影響を与えるもののみ必要) CAM,
Grad-CAM共にArchitectural ChangeやRe-Trainが必要ない iとjでSum Kで 加重平均 Kで 加重平均
Grad-CAMの結果1 - Microsoft COCO データセット - Validation Dataset からSample -
Ice Creamで誤り
Grad-CAMの結果2 VGG@ImageNetにおける間違い集 モデルがバイアスを含むかどうか
実装 - Pytorch 1.6 https://github.com/sht47/grad-cam-Pytorch1.6 - Tensorflow 2.3 https://github.com/sht47/grad-cam-Tensorflow2.3