Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NeurIPS 2021 論文読み会: How Modular should Neural M...
Search
Atsushi Takayama
January 25, 2022
Technology
230
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
NeurIPS 2021 論文読み会: How Modular should Neural Module Networks Be for Systematic Generalization?
Atsushi Takayama
January 25, 2022
More Decks by Atsushi Takayama
See All by Atsushi Takayama
最高の開発者体験の追求が開発生産性を改善し続ける文化を生み出した話
edvakf
3
1.6k
8年物のJavaのシステムをKotlinに変えていく選択に至るまで
edvakf
2
1.1k
ピクシブ社内のImageFlux利用事例紹介
edvakf
2
3.1k
学びの文化を育む社内読書会のススメ
edvakf
0
320
フルCDNアーキテクチャでサービス設計した話
edvakf
5
4.1k
Goでバイナリを読む+α
edvakf
1
1k
お前はこれまでに作ったAPIの数を覚えているのか?
edvakf
0
2.7k
「ふつうのRailsアプリケーション」についての考え方
edvakf
2
940
ggplot.galleryというお遊びウェブアプリケーションを作った話
edvakf
0
440
Other Decks in Technology
See All in Technology
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
320
FDE という解 ― 暗黙知と明示知をつなぐ、伴走型エンジニアリング ―
otanet
0
160
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
370
AIっぽい文章を採点して人間らしく直すアプリを作ってみた
yama3133
2
170
自律型AIエージェントは何を破壊するのか
kojira
0
160
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
990
作って終わりにしない タイミーのセマンティックレイヤー育成の現在地
chanyou0311
4
2.4k
On-behalf-of Token exchange with AgentCore Identity
hironobuiga
2
190
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
140
"何を作るか"を任される エンジニアは、どう育つのか
yutaokafuji
1
680
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
130
手塩にかけりゃいいってもんじゃない
ming_ayami
0
570
Featured
See All Featured
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
How to train your dragon (web standard)
notwaldorf
97
6.7k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
840
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
Being A Developer After 40
akosma
91
590k
WCS-LA-2024
lcolladotor
0
630
Facilitating Awesome Meetings
lara
57
7k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
HDC tutorial
michielstock
2
710
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
250
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
200
Transcript
How Modular should Neural Module Networks Be for Systematic Generalization?
高山温 @ NewsPicks (Uzabase group) NeurIPS 2021 論文読み会 2022/01/25
自己紹介 • Atsushi Takayama / 高山温 • 2020年からNewsPicksでCTOをしていまし たが、今年からFellowしてます ◦
データ基盤、データ分析、レコメンドエンジン、検 索エンジンなどのチームを率いています • 大学中退 → 大学院中退 → 大学院生(イマココ) ◦ 元々物理をやっていましたが、今はコンピュータサ イエンスを勉強中 • 宣伝: ユーザベースはエンジニアの多様な キャリアと多様な成長を応援する会社です
Table of Contents • VQAとは • この研究の位置付け • 研究内容 •
結果 • 所感
VQA (Visual Question Answering) • since 2015 ◦ 画像を与えられて質問に答える問題 •
2021年に人間並みの精度になった ◦ Microsoft, Alibabaなど ▪ pre-trained attention-based models 人間 95.49 80.84 67.89 80.78
この研究の位置付け 1 • SOTAとは別方向で、「少ない例で学習して、 どれだけ類似の質問に答えられるか」という 問題設定がある • 右のような例で、人間なら少し学習しただけ で類似の質問にも答えられる ◦
Systematic Generalizationという
この研究の位置付け 2 NMN: Neural Modular Networks 質問文をパースしてネットワークを構築 →少し学習しただけでそこそこ強い FiLM: End-to-Endで微分可能なネットワーク
→大量に学習しないと強くない
この研究の位置付け 3 • NMNを詳しく研究したら何かおもしろいことがわかるのでは? ◦ 例えば、End-to-Endのモデルで「質問文の構造」を学習するような機構を取り入れられな いか、とか ◦ VQAだけでなく画像認識でも Systematic
Generalizationを上げるにはどうすればいい か、とか
• 下のような画像と質問1〜3があるとする ◦ 1と2は色に関する質問、 3は文字に関する質問 • 論文のタイトル “How Modular Should
Neural Networks Be” は次 のようなイメージ ◦ 左: 全部の質問に対応できるネットワークを学習する (最もModularityが低い) ◦ 中央: 色とカテゴリーというグループごとにネットワークを学習する ◦ 右: 各質問ごとに別々のネットワークを学習する (最もModularityが高い) 研究内容 1
研究内容 2 • 少し複雑な質問でも、同様にsub-taskに分解して、Modularityが高い ネットワークから低いネットワークまでのパターンを作る
結果 1 • グラフ(a)〜(d) ◦ 質問の種類 • 横軸 ◦ 全体の何割のデータで学
習したか • 縦軸 ◦ 学習に登場しなかった類 似の質問の正答率 • 4色のバー ◦ 右に行くにつれて Modularityが高い
結果 2 • 他にも色んなデータセットで検証 • やっぱりModularityは効く (結果は割愛)
所感 • ここまで書いていて、富士通さんのテックブ ログに解説が載ってるのに気づきました • 実はまったく知らない分野でしたが、締め切 り駆動で10本ぐらい読んでみると多くのこと が学べました。誘っていただき感謝 https://blog.fltech.dev/entry/2021/12/09/neurips2021-ja