Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NeurIPS 2021 論文読み会: How Modular should Neural M...
Search
Atsushi Takayama
January 25, 2022
Technology
0
150
NeurIPS 2021 論文読み会: How Modular should Neural Module Networks Be for Systematic Generalization?
Atsushi Takayama
January 25, 2022
Tweet
Share
More Decks by Atsushi Takayama
See All by Atsushi Takayama
最高の開発者体験の追求が開発生産性を改善し続ける文化を生み出した話
edvakf
3
1.2k
8年物のJavaのシステムをKotlinに変えていく選択に至るまで
edvakf
2
1k
ピクシブ社内のImageFlux利用事例紹介
edvakf
1
2.8k
学びの文化を育む社内読書会のススメ
edvakf
0
250
フルCDNアーキテクチャでサービス設計した話
edvakf
5
3.8k
Goでバイナリを読む+α
edvakf
1
930
お前はこれまでに作ったAPIの数を覚えているのか?
edvakf
0
2.5k
「ふつうのRailsアプリケーション」についての考え方
edvakf
2
810
ggplot.galleryというお遊びウェブアプリケーションを作った話
edvakf
0
390
Other Decks in Technology
See All in Technology
3/26 クラウド食堂LT #2 GenU案件を通して学んだ教訓 登壇資料
ymae
1
220
Amebaにおける Platform Engineeringの実践
kumorn5s
2
280
Restarting_SRE_Road_to_SRENext_.pdf
_awache
1
200
コンソールで学ぶ!AWS CodePipelineの機能とオプション
umekou
2
120
スケールアップ企業のQA組織のバリューを最大限に引き出すための取り組み
tarappo
4
990
「家族アルバム みてね」を支えるS3ライフサイクル戦略
fanglang
3
450
Agile TPIを活用した品質改善事例
tomasagi
0
380
Javaの新しめの機能を知ったかぶれるようになる話 #kanjava
irof
3
5k
テキスト解析で見る PyCon APAC 2025 セッション&スピーカートレンド分析
negi111111
0
180
技術好きなエンジニアが _リーダーへの進化_ によって得たものと失ったもの / The Gains and Losses of a Tech-Enthusiast Engineer’s “Evolution into Leadership”
kaminashi
0
220
データベースで見る『家族アルバム みてね』の変遷 / The Evolution of Family Album Through the Lens of Databases
kohbis
3
870
Re:VIEWで書いた「Compose で Android の edge-to-edge に対応する」をRoo Codeで発表資料にしてもらった
tomoya0x00
0
180
Featured
See All Featured
Speed Design
sergeychernyshev
28
870
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
How to Ace a Technical Interview
jacobian
276
23k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Become a Pro
speakerdeck
PRO
27
5.2k
GraphQLとの向き合い方2022年版
quramy
45
14k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
30
1.1k
Practical Orchestrator
shlominoach
186
10k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
40
2k
How GitHub (no longer) Works
holman
314
140k
Product Roadmaps are Hard
iamctodd
PRO
52
11k
Transcript
How Modular should Neural Module Networks Be for Systematic Generalization?
高山温 @ NewsPicks (Uzabase group) NeurIPS 2021 論文読み会 2022/01/25
自己紹介 • Atsushi Takayama / 高山温 • 2020年からNewsPicksでCTOをしていまし たが、今年からFellowしてます ◦
データ基盤、データ分析、レコメンドエンジン、検 索エンジンなどのチームを率いています • 大学中退 → 大学院中退 → 大学院生(イマココ) ◦ 元々物理をやっていましたが、今はコンピュータサ イエンスを勉強中 • 宣伝: ユーザベースはエンジニアの多様な キャリアと多様な成長を応援する会社です
Table of Contents • VQAとは • この研究の位置付け • 研究内容 •
結果 • 所感
VQA (Visual Question Answering) • since 2015 ◦ 画像を与えられて質問に答える問題 •
2021年に人間並みの精度になった ◦ Microsoft, Alibabaなど ▪ pre-trained attention-based models 人間 95.49 80.84 67.89 80.78
この研究の位置付け 1 • SOTAとは別方向で、「少ない例で学習して、 どれだけ類似の質問に答えられるか」という 問題設定がある • 右のような例で、人間なら少し学習しただけ で類似の質問にも答えられる ◦
Systematic Generalizationという
この研究の位置付け 2 NMN: Neural Modular Networks 質問文をパースしてネットワークを構築 →少し学習しただけでそこそこ強い FiLM: End-to-Endで微分可能なネットワーク
→大量に学習しないと強くない
この研究の位置付け 3 • NMNを詳しく研究したら何かおもしろいことがわかるのでは? ◦ 例えば、End-to-Endのモデルで「質問文の構造」を学習するような機構を取り入れられな いか、とか ◦ VQAだけでなく画像認識でも Systematic
Generalizationを上げるにはどうすればいい か、とか
• 下のような画像と質問1〜3があるとする ◦ 1と2は色に関する質問、 3は文字に関する質問 • 論文のタイトル “How Modular Should
Neural Networks Be” は次 のようなイメージ ◦ 左: 全部の質問に対応できるネットワークを学習する (最もModularityが低い) ◦ 中央: 色とカテゴリーというグループごとにネットワークを学習する ◦ 右: 各質問ごとに別々のネットワークを学習する (最もModularityが高い) 研究内容 1
研究内容 2 • 少し複雑な質問でも、同様にsub-taskに分解して、Modularityが高い ネットワークから低いネットワークまでのパターンを作る
結果 1 • グラフ(a)〜(d) ◦ 質問の種類 • 横軸 ◦ 全体の何割のデータで学
習したか • 縦軸 ◦ 学習に登場しなかった類 似の質問の正答率 • 4色のバー ◦ 右に行くにつれて Modularityが高い
結果 2 • 他にも色んなデータセットで検証 • やっぱりModularityは効く (結果は割愛)
所感 • ここまで書いていて、富士通さんのテックブ ログに解説が載ってるのに気づきました • 実はまったく知らない分野でしたが、締め切 り駆動で10本ぐらい読んでみると多くのこと が学べました。誘っていただき感謝 https://blog.fltech.dev/entry/2021/12/09/neurips2021-ja