Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
宮脇+'23 - プログラム生成・実行による構成的推論, LLM Meetup Tokyo #3
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Shumpei Miyawaki
July 05, 2023
Technology
860
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
宮脇+'23 - プログラム生成・実行による構成的推論, LLM Meetup Tokyo #3
Shumpei Miyawaki
July 05, 2023
More Decks by Shumpei Miyawaki
See All by Shumpei Miyawaki
ITエンジニア本大賞_現場で活用するためのAIエージェント実践入門 / 2026.02.19
smiyawaki0820
1
340
著者と読み解くAIエージェント現場導入の勘所 Lancers TechBook#2
smiyawaki0820
23
13k
LLMアプリの地上戦開発計画と運用実践 / 2025.10.15 GPU UNITE 2025
smiyawaki0820
4
2k
「高い不確実性」を解消する「高い再現性」 / 2025.09.14 プロダクトヒストリーカンファレンス(YOUTRUST)
smiyawaki0820
2
480
AIエージェントを現場で使う / 2025.08.07 著者陣に聞く!現場で活用するためのAIエージェント実践入門(Findyランチセッション)
smiyawaki0820
10
2.8k
「良さそう」と「とても良い」の間には 「良さそうだがホンマか」がたくさんある / 2025.07.01 LLM品質Night
smiyawaki0820
8
3.5k
AIエージェント開発における「攻めの品質改善」と「守りの品質保証」 / 2024.04.09 GPU UNITE 新年会 2025
smiyawaki0820
3
1.5k
AIエージェントの地上戦 〜開発計画と運用実践 / 2025/04/08 Findy ランチセッション #19
smiyawaki0820
35
18k
2024.02.19 W&B AIエージェントLT会 / AIエージェントが業務を代行するための計画と実行 / Algomatic 宮脇
smiyawaki0820
15
7k
Other Decks in Technology
See All in Technology
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
210
AAIFに入ってみた ~内から見えるコミュニティ動向~
sato4
0
120
AIを「創る」と「使う」の循環 — HRテックが実践するリアルなAI組織実装
taketo957
0
1.9k
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.5k
AIソロプレナー時代に2ヶ月で20人増員した事業創造会社の開発組織の話
miyatakoji
0
510
小さくはじめるSLI/SLO ~育てながら組織に定着させる実践知~ / Starting Small with SLI/SLOs: Building Adoption Through Continuous Growth
nari_ex
2
1.1k
Disciplined Vibes: Scaling AI-Assisted Engineering
sheharyar
0
110
あなたの AI ワークスペースに、 専門コーダーを連れてくる - Amazon Quick Desktop 最新情報
kawaji_scratch
1
130
OCI Oracle AI Database Services新機能アップデート(2026/03-2026/05)
oracle4engineer
PRO
0
330
On-behalf-of Token exchange with AgentCore Identity
hironobuiga
2
120
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
1.9k
2026 TECHFRESH 畢業分享會 - AI-Native 重塑軟體工程與虛擬講師
line_developers_tw
PRO
0
580
Featured
See All Featured
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
850
The SEO Collaboration Effect
kristinabergwall1
1
480
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
200
New Earth Scene 8
popppiees
3
2.3k
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.3k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
420
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
200
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
4k
Transcript
プログラム⽣成・実⾏による構成的推論 Shumpei Miyawaki keywalker,inc. / Tohoku Univ. @catshun_ 地理空間情報 ×
⾃然⾔語処理 への応⽤
P.1 LT ⽬的 • ReAct, function calling とは異なる推論⽅法として プログラムベース構成的推論 を紹介
• 発表を通して「推論⽅法の⻑所・短所の議論」「これ出来そう」のような議論ができると嬉しい https://note.com/catshun_/n/na18e2c470b2f
プログラム⽣成・実⾏による構成的推論 Gupta+’23 - Visual Programming: Compositional Visual Reasoning Without Training
(CVPR 2023 Best Paper) https://github.com/allenai/visprog/tree/main
P.3 構成性 [Marelli+’14; Partee+’84; Frege 1892] ⽂や句の意味は、単語の意味と⽂の構造に従って構成的に理解される プログラム ⽣成・実⾏ による
構成的推論 複雑なタスク は構成性を仮定して サブタスク に分解 [Krishnamurthy+’13; Andreas+’16] (従来)既製パーサ性能 [Andreas+’16]、⾼い学習コスト [Hu+’17] が問題であった (現在)汎⽤性の⾼い LLM の出現 によって 既製パーサ性能依存・学習コスト の問題が緩和 (現在)プロンプトによるタスク分解 [Khot+’22; Dua+’22; Zhou+’23; Press+’23] も有効性が検証されている 参考︓岡崎 (東北⼤) +’15 – 単語の分散表現と構成性の計算モデルの発展 https://www.slideshare.net/naoakiokazaki/20150530-jsai2015
P.4 プログラム ⽣成・実⾏ による 構成的推論 Gupta+'23 - Visual Programming: Compositional
Visual Reasoning Without Training (CVPR) ① 物体検出(ヒト) ② 物体検出(ラクダ) ⑤ 算術演算 2 = 1 + 1 〜 〜 ʢ72"ʣώτͱϥΫμͷ߹ܭʁ 物体1 = localize ( img=画像in , query=“ヒト” ) 物体2 = localize ( img=画像in , query=“ラクダ” ) 個数1 = count ( boxes=物体1 ) 個数2 = count ( boxes=物体2 ) 答え = eval ( expr= “{個数1 } + {個数2 }” ) ① ② ③ ④ ⑤ 1. プログラム⽣成︓ 事前に定義された関数集合を⽤いて LLM がプログラムを⽣成 2. プログラム実⾏︓ ⽣成したプログラムを実⾏し最終出⼒を得る タスク⼊⼒
P.5 プログラム ⽣成・実⾏ による 構成的推論 Gupta+'23 - Visual Programming: Compositional
Visual Reasoning Without Training (CVPR) GPT-3 に few-shot のプログラム事例を与えて 対象タスクのプログラムを⽣成(右図) BMW を Audi に修正、曇り空を晴れ空に修正 ⾚い⾞を⻘い⾞に修正 ⽩い Audi をポップに彩って Nicole Kidman の顔を :p に修正して
P.6 プログラム ⽣成・実⾏ による 構成的推論 Gupta+'23 - Visual Programming: Compositional
Visual Reasoning Without Training (CVPR) ③ の⽂字列を解析 { ”kwargs”: { ”boxes”: ”物体1 ” }, ”function”: ”count”, ”output”: ”個数1 ” } 物体1 = localize ( img=画像in , query=“ヒト” ) 物体2 = localize ( img=画像in , query=“ラクダ” ) 個数1 = count ( boxes=物体1 ) ① ② ③ GPT-3 が⽣成したプログラムを逐次実⾏ 実⾏結果を保存 ”物体1 ”: , ”物体2 ”: , program.state key = kwargs[“boxes”] boxes = program.state[key] program.state[output] = len(boxes) ③ を実⾏ ③ の結果を保存
P.7 結局どれが良いの︖(個⼈的妄想) 推論⽅式 ⾔語 (柔軟性) LLM 呼出 内省・検証 リスク ReAct
ボトムアップ ⾃然⾔語 (⾼い) 思考回数分 Reflexion hallucination snowballing function calling ボトムアップ ⾃然⾔語 (⾼い) 思考回数分 (×1~2) ︖ プログラマ依存 プログラム 構成的推論 トップダウン プログラム⾔語 (低い) プログラム⽣成分 PEARL プログラマ依存 A. タスク設計に応じて柔軟に使い分けるのが良い プログラムベース推論が優れるのは︓ ・タスク間で多くのサブタスクが共通する場合(視覚タスクでいうと detect, crop など) ・⼊⼒と出⼒の型が⼀意に定まる再現性のある処理(読書感想⽂などは不向き)
アプリケーションの簡単な紹介 モチベーション > 詳細 の話をするので共感いただけた⽅、 後ほどお話しできると幸いです︕ https://note.com/catshun_/n/na18e2c470b2f
P.9 どんなアプリケーションか︖ 🙆 ⾸都圏の⼋⽉に⾏われる花⽕⼤会 (動機)地理空間情報の関連タスク(旅⾏計画・マップ作成など)ではサブタスクが共通している (概要)マップ作成アプリケーション(ToDo: 旅⾏計画) 1. ユーザからのクエリ解析 2.
“⾸都圏 ⼋⽉ 花⽕⼤会” で Google 検索 3. 検索結果からクエリに該当する場所情報を取得 4. 各場所に対してジオコーディング 5. 結果を Google Map 上にプロット これらのサブタスクは旅⾏計画等でも共通する → プログラムベース構成的推論 を採⽤
P.10 アプリケーション構成図
P.11 興味︓マルチモーダル × ⾔語媒介推論 ⾔語 Enc 記憶領域 ⾔語 Dec 多くのアプリケーションの対象範囲
実世界の事象 実世界へ投影 ここをやりたい ここ × 時間変化 空間変化 旅⾏先到着など GPS 情報が変化したらユーザ嗜好に合わせて 歴史情報、アニメ聖地、飲⾷店マップ等の旅⾏ガイドを⾃動で作成する → 旅⾏計画~旅先~振り返り をサポートしてくれる旅⾏代理エージェント
P.12 動機︓「検索からマップ表⽰まで」のシームレスな接続をしたい じゃらん AI や Google Map などは素晴らしいアプリケーションだが、 検索結果と地理空間情報が必ずしもマッチしている訳ではない ⾔語
Enc 記憶領域 ⾔語 Dec 実世界の事象 実世界へ投影
P.13 さいごに もしモチベーションに共感された⽅がいましたら、 後ほどお話しできると幸いです︕