Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250529_AGI開発のジレンマ
Search
Yusuke Hayashi
May 28, 2025
210
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20250529_AGI開発のジレンマ
Yusuke Hayashi
May 28, 2025
More Decks by Yusuke Hayashi
See All by Yusuke Hayashi
1. CPC理論の展開と集合的知能モデル(JSAI2026 KS-27 集合的予測符号化と新たな知性の時代)
hayashiyus884
1
210
AIアライメントの新たな地平: CPC理論から展望する人間とAIの協調的未来
hayashiyus884
0
38
CPC Spring Camp 2025: A New Mathematical Theory of Communication
hayashiyus884
0
150
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
698
190k
Thoughts on Productivity
jonyablonski
76
5.2k
How to train your dragon (web standard)
notwaldorf
97
6.7k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
170
Designing for humans not robots
tammielis
254
26k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Rails Girls Zürich Keynote
gr2m
96
14k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
The Curse of the Amulet
leimatthew05
2
13k
The World Runs on Bad Software
bkeepers
PRO
72
12k
The untapped power of vector embeddings
frankvandijk
2
1.8k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Transcript
Page. 1 Yusuke Hayashi || 2025.05.29 Y u s u
k e H a y a s h i | | 2 0 2 5 . 0 5 . 2 9 P a g e . 0 AIの自律性と自発性 39th The Japanese Society for Artificial Intelligence: JSAI 2025 Yusuke Hayashi (AI Alignment Network)
Page. 2 Yusuke Hayashi || 2025.05.29
Page. 3 Yusuke Hayashi || 2025.05.29 普遍的知能指数 : Legg-Hutter 知能指数
• 「様々な環境下での報酬獲得能力」を,環境系の単純さで割引しつつ合計した知能指数 普遍的な知性の尺度? AIXI : Legg-Hutter 知能指数を最大化するAIエージェント • 普遍的帰納 ξ (Solomonoff universal prior, すべての計算可能な環境系に対して で重み付けする確率分布) つまり最適な事前分布(信念)を持ったBayesian強化学習エージェント 概要 • 世界をどう信じるか(ベイズ推論) • あり得るすべてのプログラム(=環境モデル)を並べ,プログラム長 K に応じた重み を掛ける。 • どう行動を選ぶか(逐次意思決定理論) • 各行動の先に待っている報酬をすべての仮説環境で評価し,重み付き平均が最大になる行動を選ぶ。 • これを毎ステップ繰り返し,割引率なしで生涯報酬を最大化する。 普遍的帰納 ξ は計算不可能!! 知性の尺度は様々: IQ, EQ, Gardner MI, …
Page. 4 Yusuke Hayashi || 2025.05.29 AIXIに至る道程 : Self-AIXI AIXI
が持つ最適戦略に漸近していく戦略を備えたBayesian強化学習エージェント • 「想像できるすべての計算可能な世界」 を頭の中に展開し,その中で最も得をする行動だけを選び続ける ――ただし夢物語レベルでしか動かない究極エージェントに漸近していくAIエージェント Self-AIXIの報酬関数にはエンパワーメント最大化(自律性の強化)が含まれる
Page. 5 Yusuke Hayashi || 2025.05.29 主張の背景にある数理 相互情報量と変分エンパワーメントの関係 正則化項の最小化=変分エンパワーメントの最大化
Page. 6 Yusuke Hayashi || 2025.05.29 AGI開発のジレンマ • エンパワーメント最大化を行わないと(Legg-Hutter 知能指数の意味で最適な)AIXIには到達できない
• つまり,AGIに到達するためにはAIエージェントの自律性を強化していく必要がある • 自律性を強化すると,AIエージェントはユーザーの指示に従わなくなる傾向がある(ジレンマ)