Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Grad-CAMの始まりのお話

 Grad-CAMの始まりのお話

EAGLYS株式会社 AI 勉強会第4回の資料になります。

Grad-CAMの実装とそのアイデアの元となったCAMやGuided-Back-Propagationについて説明しています。

Shintaro Yoshida

October 25, 2020
Tweet

More Decks by Shintaro Yoshida

Other Decks in Research

Transcript

  1. Grad-CAMの特徴 • Grad-CAM(Gradient-weighted Class Activation Mapping, 2016, Ramprasaath) ◦ XAIで最も有名なもの(理由はGrad-CAMのページで説明)

    ◦ CAM(2015, Zhou) の弱点を克服し、全てのCNNモデルに対して一般化 • XAI(Explainable Artificial Intelligence) の目的 (筆者の長期的な視点) 失敗の原因を特定 (モデル << 人間) 予測の根拠を説明し、判定の信頼⬆ (モデル ≒ 人間) 人間がAIに教わる (モデル >> 人間)
  2. NIN(Network In Network, 2014 Lin et al) - 偉大な論文 (2つのメインアイデア)

    計算量削減のために1x1 Convを導入 ( InceptionNetのアイデアの源、ResNet Botttleneck Block) GAP(Global Average Pooling) を提案 → 最近だとAdaptive Average Pooling • GAP Structural Regularizerとして機能 ◦ Feature MapとCategory間の関係がより自然に ◦ 追加のParameterが不要 ◦ Spatial TranslationにRobust
  3. Object Detectors Emerge In Deep Scene Cnns(2015 Zhou et al)

    - Scene Recognitionの問題を解く → Object Detector が出現した Objectの正解ラベルを与えていないのに。。。 先行研究として、Object Classification問題のCNNで、Object Localizationの出現 Places Database (2014 Zhou et al )
  4. CAM(Class Activation Mapping 2015 Zhou et al) … … Final

    Conv GAP FC k枚 k個 … c個 a a 1 を用いて CAMを生成
  5. CAM(Class Activation Mapping) … … Final Conv GAP FC 4096枚

    4096個 … 1000個 VGG16 (ImageNet) 7 7