Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NeurIPS 2021 論文読み会: How Modular should Neural M...
Search
Atsushi Takayama
January 25, 2022
Technology
0
180
NeurIPS 2021 論文読み会: How Modular should Neural Module Networks Be for Systematic Generalization?
Atsushi Takayama
January 25, 2022
Tweet
Share
More Decks by Atsushi Takayama
See All by Atsushi Takayama
最高の開発者体験の追求が開発生産性を改善し続ける文化を生み出した話
edvakf
3
1.4k
8年物のJavaのシステムをKotlinに変えていく選択に至るまで
edvakf
2
1.1k
ピクシブ社内のImageFlux利用事例紹介
edvakf
2
2.9k
学びの文化を育む社内読書会のススメ
edvakf
0
290
フルCDNアーキテクチャでサービス設計した話
edvakf
5
4k
Goでバイナリを読む+α
edvakf
1
970
お前はこれまでに作ったAPIの数を覚えているのか?
edvakf
0
2.7k
「ふつうのRailsアプリケーション」についての考え方
edvakf
2
890
ggplot.galleryというお遊びウェブアプリケーションを作った話
edvakf
0
420
Other Decks in Technology
See All in Technology
AI時代におけるアジャイル開発について
polyscape_inc
0
120
【AWS re:Invent 2025速報】AIビルダー向けアップデートをまとめて解説!
minorun365
4
420
HIG学習用スライド
yuukiw00w
0
110
モバイルゲーム開発におけるエージェント技術活用への試行錯誤 ~開発効率化へのアプローチの紹介と未来に向けた展望~
qualiarts
0
530
著者と読み解くAIエージェント現場導入の勘所 Lancers TechBook#2
smiyawaki0820
11
5.4k
EM歴1年10ヶ月のぼくがぶち当たった苦悩とこれからへ向けて
maaaato
0
150
Overture Maps Foundationの3年を振り返る
moritoru
0
110
Oracle Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
0
660
生成AI時代の自動E2Eテスト運用とPlaywright実践知_引持力哉
legalontechnologies
PRO
0
180
法人支出管理領域におけるソフトウェアアーキテクチャに基づいたテスト戦略の実践
ogugu9
1
190
小さな判断で育つ、大きな意思決定力 / 20251204 Takahiro Kinjo
shift_evolve
PRO
1
490
計算機科学をRubyと歩む 〜DFA型正規表現エンジンをつくる~
ydah
3
130
Featured
See All Featured
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.7k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.6k
Producing Creativity
orderedlist
PRO
348
40k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.1k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
54k
Git: the NoSQL Database
bkeepers
PRO
432
66k
Code Reviewing Like a Champion
maltzj
527
40k
Practical Orchestrator
shlominoach
190
11k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
710
4 Signs Your Business is Dying
shpigford
186
22k
KATA
mclloyd
PRO
32
15k
Embracing the Ebb and Flow
colly
88
4.9k
Transcript
How Modular should Neural Module Networks Be for Systematic Generalization?
高山温 @ NewsPicks (Uzabase group) NeurIPS 2021 論文読み会 2022/01/25
自己紹介 • Atsushi Takayama / 高山温 • 2020年からNewsPicksでCTOをしていまし たが、今年からFellowしてます ◦
データ基盤、データ分析、レコメンドエンジン、検 索エンジンなどのチームを率いています • 大学中退 → 大学院中退 → 大学院生(イマココ) ◦ 元々物理をやっていましたが、今はコンピュータサ イエンスを勉強中 • 宣伝: ユーザベースはエンジニアの多様な キャリアと多様な成長を応援する会社です
Table of Contents • VQAとは • この研究の位置付け • 研究内容 •
結果 • 所感
VQA (Visual Question Answering) • since 2015 ◦ 画像を与えられて質問に答える問題 •
2021年に人間並みの精度になった ◦ Microsoft, Alibabaなど ▪ pre-trained attention-based models 人間 95.49 80.84 67.89 80.78
この研究の位置付け 1 • SOTAとは別方向で、「少ない例で学習して、 どれだけ類似の質問に答えられるか」という 問題設定がある • 右のような例で、人間なら少し学習しただけ で類似の質問にも答えられる ◦
Systematic Generalizationという
この研究の位置付け 2 NMN: Neural Modular Networks 質問文をパースしてネットワークを構築 →少し学習しただけでそこそこ強い FiLM: End-to-Endで微分可能なネットワーク
→大量に学習しないと強くない
この研究の位置付け 3 • NMNを詳しく研究したら何かおもしろいことがわかるのでは? ◦ 例えば、End-to-Endのモデルで「質問文の構造」を学習するような機構を取り入れられな いか、とか ◦ VQAだけでなく画像認識でも Systematic
Generalizationを上げるにはどうすればいい か、とか
• 下のような画像と質問1〜3があるとする ◦ 1と2は色に関する質問、 3は文字に関する質問 • 論文のタイトル “How Modular Should
Neural Networks Be” は次 のようなイメージ ◦ 左: 全部の質問に対応できるネットワークを学習する (最もModularityが低い) ◦ 中央: 色とカテゴリーというグループごとにネットワークを学習する ◦ 右: 各質問ごとに別々のネットワークを学習する (最もModularityが高い) 研究内容 1
研究内容 2 • 少し複雑な質問でも、同様にsub-taskに分解して、Modularityが高い ネットワークから低いネットワークまでのパターンを作る
結果 1 • グラフ(a)〜(d) ◦ 質問の種類 • 横軸 ◦ 全体の何割のデータで学
習したか • 縦軸 ◦ 学習に登場しなかった類 似の質問の正答率 • 4色のバー ◦ 右に行くにつれて Modularityが高い
結果 2 • 他にも色んなデータセットで検証 • やっぱりModularityは効く (結果は割愛)
所感 • ここまで書いていて、富士通さんのテックブ ログに解説が載ってるのに気づきました • 実はまったく知らない分野でしたが、締め切 り駆動で10本ぐらい読んでみると多くのこと が学べました。誘っていただき感謝 https://blog.fltech.dev/entry/2021/12/09/neurips2021-ja