Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オッカムの剃刀と汎化誤差解析
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Masanari Kimura
August 31, 2021
Research
5.3k
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
オッカムの剃刀と汎化誤差解析
Masanari Kimura
August 31, 2021
More Decks by Masanari Kimura
See All by Masanari Kimura
Equivalence of Geodesics and Importance Weighting from the Perspective of Information Geometry
mkimura
0
370
機械学習における重要度重み付けとその応用
mkimura
3
3.4k
Paper Intro: Human Rademacher Complexity
mkimura
0
240
On the principle of Invariant Risk Minimization
mkimura
0
400
論文紹介:Clustering with Bregman Divergences: an Asymptotic Analysis
mkimura
0
620
Generalization Bounds for Set-to-Set Matching with Negative Sampling
mkimura
0
190
論文紹介:On the Importance of Gradients for Detecting Distributional Shifts in the Wild
mkimura
2
900
論文紹介:Dangers of Bayesian Model Averaging under Covariate Shift
mkimura
0
380
Information Geometry of Dropout Training
mkimura
0
350
Other Decks in Research
See All in Research
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
560
重要だけど測れていないもの:高齢者ケアの見えない課題
theoriatec2024
0
370
NII S. Koyama's Lab Research Overview AY2026
skoyamalab
0
340
AIエージェント時代のLLM-jpモデルのあるべき姿
k141303
0
480
論文紹介:HalluCitation Matters
wasyro
0
100
第64回CV・PRML勉強会 論文紹介:Linguistic Priors for Visual Decoupling: Towards Symmetric Vision-Brain Alignment
sokikatayama
0
110
typst の使い方:言語学を研究する学生のために
gitomochang
0
460
量子コンピュータの紹介
oqtopus
0
340
データセンター事業者を取り巻く近年の状況とその中での研究開発動向、テストベッドへの貢献の可能性
kikuzo
1
220
[IR Reading 2026春 論文紹介] LLM-based Listwise Reranking under the Effect of Positional Bias (ECIR 2026) /IR-Reading-2026-Spring
koheishinden
PRO
0
140
R&Dチームを起ち上げる
shibuiwilliam
1
270
2026年3月1日(日)福島「除染土」の公共利用をかんがえる
atsukomasano2026
0
650
Featured
See All Featured
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.6k
Git: the NoSQL Database
bkeepers
PRO
432
67k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
GitHub's CSS Performance
jonrohan
1033
470k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
170
GraphQLとの向き合い方2022年版
quramy
50
15k
Optimising Largest Contentful Paint
csswizardry
37
3.7k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
400
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
210
Joys of Absence: A Defence of Solitary Play
codingconduct
1
400
Java REST API Framework Comparison - PWX 2021
mraible
34
9.4k
Transcript
Intro Occan Bound Additional Discussions References オッカムの剃刀と汎化誤差解析 Masanari Kimura
[email protected]
August 31, 2021
Intro Occan Bound Additional Discussions References Intro 2/11
Intro Occan Bound Additional Discussions References TL;DR ▶ オッカムの剃刀の概念について説明; ▶
オッカムの剃刀の形式化と汎化誤差解析への応用について説明. 3/11
Intro Occan Bound Additional Discussions References オッカムの剃刀(Occam’s Razor) オッカム [Drouhin,
2006] 必要が無いなら多くのものを定立してはならない.少数の論理でよい場合は多数の論理を 定立してはならない. ▶ ある二つの理論が同程度にデータを説明できているとき,より単純な方が好まれる; ▶ 統計的機械学習において単純さは直感的にだけでなく定量的に測れる; ▶ 以下ではオッカムの剃刀を形式的に記述していく. 4/11
Intro Occan Bound Additional Discussions References Occan Bound 5/11
Intro Occan Bound Additional Discussions References Occam Bound Theorem 独立かつ同一なサンプルサイズ
m のデータセット S = {x, y} とある仮説 h ∈ H について 少なくとも 1 − δ の確率で以下が成り立つ: L(h) ≤ ˆ L(h) + √ (ln 2)|h| + ln 1 δ 2m . (1) ただし,|h| は仮説 h を記述するのに必要な bit 数であり, L(h) := E [ 1[h(x) ̸= y] ] , (2) ˆ L(h) := 1 m m ∑ i=1 1[h(xi) ̸= yi]. (3) 6/11
Intro Occan Bound Additional Discussions References Proof of the Occam
Bound Proof. 定理に矛盾する仮説集合を B とする: B := { L(h) ≥ ˆ L(h) + √ (ln 2)|h| + ln 1 δ 2m ; h ∈ H } (4) このとき, P [ h ∈ B ] ≤ ∑ h∈H exp { −2m (√ (ln 2)|h| + ln 1 δ 2m )2 } (∵ Chernoff bound) (5) = ∑ h∈H δ2−|h| = δ ∑ h∈H 2−|h| ≤ δ (∵ Kraft inequality) (6) 7/11
Intro Occan Bound Additional Discussions References Occam Bound と仮説選択 Occam
bound は期待誤差の上界を与えるので,これを最小化するように仮説選択をする ことが考えられる: ˆ h = arg min h∈H ˆ L(h) + √ (ln 2)|h| + ln 1 δ 2m . (7) ▶ この最適化は,手元へのデータの説明能力(第一項)とモデルのシンプルさ(第二 項)の最小化のトレードオフになっている; ▶ これは,ある h1 , h2 ∈ H がもし同じだけデータを説明できるとき,よりシンプルな方 が未知のデータへの誤差を小さくできる可能性が高いことを意味している; ▶ これはまさしくオッカムの剃刀の形式的な記述になっている. 8/11
Intro Occan Bound Additional Discussions References Additional Discussions 9/11
Intro Occan Bound Additional Discussions References Occam Bound のベイズ的解釈 P
を h に関する確率分布とし,|h|P を以下のように定義する: |h|P := log 2 1 P(h) . (8) このとき,Occam bound は次のように書き換えることができる: L(h) ≤ ˆ L(h) + √ (ln 2)|h|P + ln 1 δ 2m . (9) これはまさしく仮説集合に関する任意の事前分布を考えた場合の Occam bound に相当 する. 10/11
Intro Occan Bound Additional Discussions References References I Nicolas Drouhin.
Pluralitas non est ponenda sine neccesitate. Technical report, GRID Working paper, 2006. 11/11