Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介: Attention is not Explanation
Search
Yumeto Inaoka
March 19, 2019
Research
520
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
文献紹介: Attention is not Explanation
Yumeto Inaoka
March 19, 2019
More Decks by Yumeto Inaoka
See All by Yumeto Inaoka
文献紹介: Quantity doesn’t buy quality syntax with neural language models
yumeto
1
220
文献紹介: Open Domain Web Keyphrase Extraction Beyond Language Modeling
yumeto
0
280
文献紹介: Self-Supervised_Neural_Machine_Translation
yumeto
0
190
文献紹介: Comparing and Developing Tools to Measure the Readability of Domain-Specific Texts
yumeto
0
210
文献紹介: PAWS: Paraphrase Adversaries from Word Scrambling
yumeto
0
210
文献紹介: Beyond BLEU: Training Neural Machine Translation with Semantic Similarity
yumeto
0
320
文献紹介: EditNTS: An Neural Programmer-Interpreter Model for Sentence Simplification through Explicit Editing
yumeto
0
420
文献紹介: Decomposable Neural Paraphrase Generation
yumeto
0
250
文献紹介: Analyzing the Limitations of Cross-lingual Word Embedding Mappings
yumeto
0
280
Other Decks in Research
See All in Research
人間中心の意思決定支援AI
yukinobaba
PRO
5
2.6k
Unified Audio Source Separation (Defense Slides)
kohei_1979
1
610
Data Visualization Tools in the Age of AI
flekschas
0
160
姫路市 -都市OSの「再実装」-
hopin
0
1.7k
The Landscape of Agentic Reinforcement Learning for LLMs: A Survey
shunk031
4
1k
重要だけど測れていないもの:高齢者ケアの見えない課題
theoriatec2024
0
330
東京大学工学部計数工学科、計数工学特別講義の説明資料
kikuzo
0
470
[チュートリアル] 電波マップ構築入門 :研究動向と課題設定の勘所
k_sato
0
480
AIを叩き台として、 「検証」から「共創」へと進化するリサーチ
mela_dayo
0
280
CyberAgent AI Lab研修 / Social Implementation Anti-Patterns in AI Lab
chck
7
4.6k
PGDM: Physically Guided Diffusion Model for L Downscaling
satai
2
270
NII S. Koyama's Lab Research Overview AY2026
skoyamalab
0
290
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.9k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
390
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
220
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
1
540
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
6k
Color Theory Basics | Prateek | Gurzu
gurzu
0
360
Joys of Absence: A Defence of Solitary Play
codingconduct
1
390
Information Architects: The Missing Link in Design Systems
soysaucechin
0
970
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
Speed Design
sergeychernyshev
33
1.8k
Designing for Timeless Needs
cassininazir
1
250
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Transcript
Attention is not Explanation 文献紹介 2019/03/19 長岡技術科学大学 自然言語処理研究室 稲岡 夢人
Literature 2 Title Attention is not Explanation Author Sarthak Jain,
Byron C. Wallace Conference NAACL-HLT 2019 Paper https://arxiv.org/abs/1902.10186
Abstract Attentionは入力単位で重みを示す その分布が重要性を示すものとして扱われることがある → 重みと出力の間の関係は明らかにされていない 標準的なAttentionは意味のある説明を提供しておらず、 そのように扱われるべきでないことを示す
3
調査方法 1. 重みが重要度と相関しているか 2. 事実と反する重み設定が予測を変化させるか 4
Tasks Binary Text Classification Question Answering (QA)
Natural Language Inference (NLI) 5
Datasets 6
Results 7
Definitions 出力結果の比較に使用する距離 Attentionの比較に使用する距離 8
Results Attentionの変化を大きくしても結果が変化しない → 出力への影響が小さい 9
Results DiabetesはPositiveのクラスにおいては影響が大きい → 高精度で糖尿病を示すトークンが存在するため 10
Adversarial Attention 出力を大きく変化させるようにAttentionを変化させる Attentionが少し変化しただけで出力が大きく変化するか ← Attentionの挙動を確認 12
Results 少しのAttentionの変化で出力が大きく変化している 13
Conclusions 重要度とAttentionの重みは相関が弱い 事実に反する重みは必ずしも出力を変化させない Seq2seqについては今後の課題とする 14