Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オッカムの剃刀と汎化誤差解析
Search
Masanari Kimura
August 31, 2021
Research
5.3k
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
オッカムの剃刀と汎化誤差解析
Masanari Kimura
August 31, 2021
More Decks by Masanari Kimura
See All by Masanari Kimura
Equivalence of Geodesics and Importance Weighting from the Perspective of Information Geometry
mkimura
0
370
機械学習における重要度重み付けとその応用
mkimura
3
3.4k
Paper Intro: Human Rademacher Complexity
mkimura
0
240
On the principle of Invariant Risk Minimization
mkimura
0
400
論文紹介:Clustering with Bregman Divergences: an Asymptotic Analysis
mkimura
0
620
Generalization Bounds for Set-to-Set Matching with Negative Sampling
mkimura
0
190
論文紹介:On the Importance of Gradients for Detecting Distributional Shifts in the Wild
mkimura
2
900
論文紹介:Dangers of Bayesian Model Averaging under Covariate Shift
mkimura
0
380
Information Geometry of Dropout Training
mkimura
0
350
Other Decks in Research
See All in Research
セマンティック通信勉強会 6Gに向けたデバイス間効率的な通信の技術紹介・課題・今後展望
satai
3
170
AIで最適化を解けるか?
mickey_kubo
0
120
LLMアプリケーションの透明性について
fufufukakaka
0
240
NII S. Koyama's Lab Research Overview AY2026
skoyamalab
0
340
機械学習で作った ポケモン対戦bot で 遊ぼう!
fufufukakaka
0
320
「なんとなく」の顧客理解から脱却する ──顧客の解像度を武器にするインサイトマネジメント
tajima_kaho
10
7.7k
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
850
Anthropic が提案する LLM の内部状態を自然言語で説明可能にした Natural Language Autoencoders / Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations
shunk031
0
130
Unified Audio Source Separation (Defense Slides)
kohei_1979
1
620
LINEヤフー データサイエンス Meetup「三井物産コモディティ予測チャレンジ」の舞台裏-AlpacaTechパート
gamella
1
580
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
990
コーディングエージェントとABNを再考
hf149
2
730
Featured
See All Featured
For a Future-Friendly Web
brad_frost
183
10k
ラッコキーワード サービス紹介資料
rakko
1
3.7M
AI: The stuff that nobody shows you
jnunemaker
PRO
8
730
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
340
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
160
Accessibility Awareness
sabderemane
1
140
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
210
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
150
Code Review Best Practice
trishagee
74
20k
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
1
540
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
610
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
290
Transcript
Intro Occan Bound Additional Discussions References オッカムの剃刀と汎化誤差解析 Masanari Kimura
[email protected]
August 31, 2021
Intro Occan Bound Additional Discussions References Intro 2/11
Intro Occan Bound Additional Discussions References TL;DR ▶ オッカムの剃刀の概念について説明; ▶
オッカムの剃刀の形式化と汎化誤差解析への応用について説明. 3/11
Intro Occan Bound Additional Discussions References オッカムの剃刀(Occam’s Razor) オッカム [Drouhin,
2006] 必要が無いなら多くのものを定立してはならない.少数の論理でよい場合は多数の論理を 定立してはならない. ▶ ある二つの理論が同程度にデータを説明できているとき,より単純な方が好まれる; ▶ 統計的機械学習において単純さは直感的にだけでなく定量的に測れる; ▶ 以下ではオッカムの剃刀を形式的に記述していく. 4/11
Intro Occan Bound Additional Discussions References Occan Bound 5/11
Intro Occan Bound Additional Discussions References Occam Bound Theorem 独立かつ同一なサンプルサイズ
m のデータセット S = {x, y} とある仮説 h ∈ H について 少なくとも 1 − δ の確率で以下が成り立つ: L(h) ≤ ˆ L(h) + √ (ln 2)|h| + ln 1 δ 2m . (1) ただし,|h| は仮説 h を記述するのに必要な bit 数であり, L(h) := E [ 1[h(x) ̸= y] ] , (2) ˆ L(h) := 1 m m ∑ i=1 1[h(xi) ̸= yi]. (3) 6/11
Intro Occan Bound Additional Discussions References Proof of the Occam
Bound Proof. 定理に矛盾する仮説集合を B とする: B := { L(h) ≥ ˆ L(h) + √ (ln 2)|h| + ln 1 δ 2m ; h ∈ H } (4) このとき, P [ h ∈ B ] ≤ ∑ h∈H exp { −2m (√ (ln 2)|h| + ln 1 δ 2m )2 } (∵ Chernoff bound) (5) = ∑ h∈H δ2−|h| = δ ∑ h∈H 2−|h| ≤ δ (∵ Kraft inequality) (6) 7/11
Intro Occan Bound Additional Discussions References Occam Bound と仮説選択 Occam
bound は期待誤差の上界を与えるので,これを最小化するように仮説選択をする ことが考えられる: ˆ h = arg min h∈H ˆ L(h) + √ (ln 2)|h| + ln 1 δ 2m . (7) ▶ この最適化は,手元へのデータの説明能力(第一項)とモデルのシンプルさ(第二 項)の最小化のトレードオフになっている; ▶ これは,ある h1 , h2 ∈ H がもし同じだけデータを説明できるとき,よりシンプルな方 が未知のデータへの誤差を小さくできる可能性が高いことを意味している; ▶ これはまさしくオッカムの剃刀の形式的な記述になっている. 8/11
Intro Occan Bound Additional Discussions References Additional Discussions 9/11
Intro Occan Bound Additional Discussions References Occam Bound のベイズ的解釈 P
を h に関する確率分布とし,|h|P を以下のように定義する: |h|P := log 2 1 P(h) . (8) このとき,Occam bound は次のように書き換えることができる: L(h) ≤ ˆ L(h) + √ (ln 2)|h|P + ln 1 δ 2m . (9) これはまさしく仮説集合に関する任意の事前分布を考えた場合の Occam bound に相当 する. 10/11
Intro Occan Bound Additional Discussions References References I Nicolas Drouhin.
Pluralitas non est ponenda sine neccesitate. Technical report, GRID Working paper, 2006. 11/11