Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
oku-slide-stat1-7
Search
Makito Oku
March 29, 2022
Education
0
280
oku-slide-stat1-7
数理統計学特論I
第7回 推定論
奥 牧人 (未病研究センター)
2022/06/01
2023/05/31
2024/05/29
Makito Oku
March 29, 2022
Tweet
Share
More Decks by Makito Oku
See All by Makito Oku
oku-slide-20240802
okumakito
0
73
oku-slide-20231129
okumakito
0
100
oku-slide-20230827
okumakito
0
110
oku-slide-20230213
okumakito
0
210
oku-slide-20221212
okumakito
0
79
oku-slide-20221129
okumakito
0
150
oku-slide-20221115
okumakito
0
290
oku-slide-20220820
okumakito
0
270
oku-slide-stat1-1
okumakito
0
270
Other Decks in Education
See All in Education
Tableau トレーニング【株式会社ニジボックス】
nbkouhou
0
19k
アニメに学ぶチームの多様性とコンピテンシー
terahide
0
240
コンセプトシェアハウス講演資料
uchinomasahiro
0
390
Algo de fontes de alimentación
irocho
1
360
Canva
matleenalaakso
0
430
HTML5 and the Open Web Platform - Lecture 3 - Web Technologies (1019888BNR)
signer
PRO
1
2.6k
Design Guidelines and Models - Lecture 5 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
680
Ch2_-_Partie_1.pdf
bernhardsvt
0
110
2409_CompanyInfo_Hanji_published.pdf
yosukemurata
0
370
Qualtricsで相互作用実験する「SMARTRIQS」実践編
kscscr
0
290
情報処理工学問題集 /infoeng_practices
kfujita
0
120
construindo uma carreira com opensource
caarlos0
0
240
Featured
See All Featured
Producing Creativity
orderedlist
PRO
341
39k
Site-Speed That Sticks
csswizardry
0
26
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
Testing 201, or: Great Expectations
jmmastey
38
7.1k
Designing for humans not robots
tammielis
250
25k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
720
Adopting Sorbet at Scale
ufuk
73
9.1k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
506
140k
How GitHub (no longer) Works
holman
310
140k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
How to Ace a Technical Interview
jacobian
276
23k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
47
2.1k
Transcript
数理統計学特論I 第7回 推定論 奥 牧人 (未病研究センター) 2024/05/29 1 / 37
前回の復習 前回の目的 十分統計量とその関連用語の意味を理解すること 前回の達成目標 十分統計量の意味を説明できる。 十分統計量の分解定理を説明できる。 ラオ・ブラックウェルの定理を説明できる。 完備十分統計量の意味を説明できる。 2 /
37
今回の位置付け 1. 前置きと準備 2. 確率と1次元の確率変数 3. 多次元の確率変数 4. 統計量と標本分布 5.
統計的決定理論の枠組み 6. ⼗分統計量 7. 推定論 8. 検定論 9. 区間推定 10. 正規分布、2項分布に関する推測 その他の話題 11. 線形モデル 12. ノンパラメトリック法 13. 漸近理論 14. ベイズ法 確率と統計の基礎 良い点推定とは︖ 良い検定とは︖ 問題設定と準備 7章と8章に関する証明 回帰分析と分散分析を統⼀的に理解 常⽤される⼿法を改めて整理 ベイズ統計を簡単に紹介 ノンパラを簡単に紹介 3 / 37
今回の目的と達成目標 目的 点推定の最適性に関する理論について理解すること 達成目標 不偏推定量の意味を説明できる。 フィッシャー情報量の意味を説明できる。 クラメル・ラオの不等式の意味を説明できる。 不偏推定の問題点を説明できる。 最尤推定量の意味と漸近有効性を説明できる。 4
/ 37
予習用キーワードの確認 不偏推定 尤度関数 5 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 6 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 7 / 37
推定における記法と設定 推定では、決定関数 のことを または単に と書き、 推定量と呼ぶ リスク関数として平均二乗誤差を使う バイアス-バリアンス分解 (ここだけ とおく)
をバイアスと呼ぶ δ(X) ^ θ(X) ^ θ R(θ, ^ θ) = E[( ^ θ − θ) 2 ] E[ ^ θ] = μ E[( ^ θ − θ) 2 ] = E[( ^ θ − μ + μ − θ) 2 ] = E[( ^ θ − μ) 2 ] + E[(μ − θ) 2 ] + 0 = V [ ^ θ] + (μ − θ) 2 μ − θ 8 / 37
バイアスとバリアンス 母集団から標本を抽出して を計算、を何度も行うとする。 バリアンス は、推定値のバラツキの大きさを表す。 バイアス は、推定値の平均と真の値のズレを表す。 ^ θ V
[ ^ θ] E[ ^ θ] − θ 9 / 37
不偏推定量 が不偏推定量であるとは、以下が成り立つこと 例、不偏分散 (参考) 最尤推定の場合 ^ θ E[ ^ θ]
= θ, ∀θ s 2 = 1 n − 1 n ∑ i=1 (Xi − ¯ X) 2 s 2 n = 1 n n ∑ i=1 (Xi − ¯ X) 2 10 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 11 / 37
一様最小分散不偏推定量 不偏推定の場合、平均二乗誤差は分散 のみになる 従って、不偏推定量の中では、分散が最小となるものが最適 一様最小分散不偏推定量 (Uniformly Minimum Variance Unbiaced estimator,
略して UMVU と書く) 不偏推定量 が UMVU であるとは、任意の不偏推定量 に 対して以下が成り立つこと V [ ^ θ] E[( ^ θ − θ) 2 ] = V [ ^ θ] ^ θ ∗ ^ θ V [ ^ θ ∗ ] ≤ V [ ^ θ], ∀θ 12 / 37
話の流れを整理 不偏推定量 UMVU (不偏の中で最適) UMVU であることを示す方法 1. クラメル・ラオの不等式を使う方法 (フィッシャー情報量 を含む)
2. 完備十分統計量を使う方法 最尤推定量 13 / 37
フィッシャー情報量 の確率質量関数または確率密度関数 を、パラメータ を明示して と書く フィッシャー情報量 対数尤度関数 とし、 と書け ば、以下のように略記できる
の場合 が成り立つ X = (X1 , … , Xn ) p(x) θ f(x, θ) In (θ) = E [( ∂ ∂θ log f(x, θ)) 2 ] ℓ(θ) = log f(x, θ) ℓ ′ (θ) = ∂ℓ(θ)/∂θ In (θ) = E[ℓ ′ (θ) 2 ] X1 , … , Xn i.i.d. ∼ F In (θ) = nI1 (θ) 14 / 37
クラメル・ラオの不等式 クラメル・ラオの不等式 ( は不偏推定量) ただし、 と、微分と積分が交換可能なこと (正則条件) を仮定 [定理] クラメル・ラオの不等式が成り立つ場合、不偏推定量
が以下を満たせば UMVU である ^ θ V [ ^ θ] ≥ 1 In (θ) In (θ) > 0 ^ θ ∗ V [ ^ θ ∗ ] = 1 In (θ) , ∀θ 15 / 37
例 の の推定量 について計算 の確率密度関数 ( より 個分で良い) 対数尤度関数 で偏微分
X1 , … , Xn i.i.d. ∼ N (μ, σ2 ) μ ¯ X Xi In (θ) = nI1 (θ) 1 f(xi , μ) = 1 √2πσ exp (− (xi − μ) 2 2σ2 ) ℓ(μ) = log f(xi , μ) = − (xi − μ)2 2σ2 − 1 2 log(2πσ 2 ) μ ℓ ′ (μ) = ∂ ∂μ ℓ(μ) = xi − μ σ2 16 / 37
例、続き フィッシャー情報量 クラメル・ラオの不等式の下界は、 これは に一致するので、 は確かに UMVU である。 I1 (μ)
= E[ℓ ′ (μ) 2 ] = E [ (Xi − μ) 2 σ4 ] = 1 σ2 1 In (μ) = 1 nI1 (μ) = σ2 n V [ ¯ X] ¯ X ¯ X ∼ N (μ, σ2 n ) 17 / 37
分散は? クラメル・ラオの不等式では不偏分散 が UMVU であることを 示せない UMVU なのだが、下界を達成しない 次に紹介する別の方法で証明する s
2 18 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 19 / 37
完備十分統計量とUMVU [定理] 完備十分統計量 の関数である不偏推定量 は一意に定ま り UMVU となる。 また、任意の不偏推定量を とするとき
は に一致 する。 T ^ θ∗ (T ) ^ θ E[ ^ θ|T ] ^ θ∗ (T ) 20 / 37
証明 完備統計量の関数となる不偏推定量は一意であることを示す , を不偏推定量とし、 とおけば なので、完備性の定義より 続いて、任意の不偏推定量 に対して、 を完備十分とし を作ると、不偏となるので一意に定まる。
は十分統計量なので ラオ・ブラックウェルの定理を適用すれば ^ θ 1 ^ θ 2 g(T ) = ^ θ 1 (T ) − ^ θ 2 (T ) E[g(T )] = θ − θ = 0, ∀θ ^ θ1 (T ) ≡ ^ θ2 (T ) ^ θ T ^ θ ∗ (T ) = E[ ^ θ|T ] T V [ ^ θ ∗ ] ≤ V [ ^ θ], ∀θ 21 / 37
例 母集団が正規分布 のとき、以下は完備十分統計量 , は完備十分統計量 の関数の形をしている , は不偏である 従って、 ,
は UMVU である N (μ, σ 2 ) T1 = n ∑ i=1 Xi , T2 = n ∑ i=1 X 2 i ¯ X s 2 T = (T1 , T2 ) ¯ X = T1 n , s 2 = T2 − T 2 1 /n n − 1 ¯ X s 2 E[ ¯ X] = μ, E[s 2 ] = σ 2 ¯ X s 2 22 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 23 / 37
不偏推定の問題点 母数の変換に対して不変ではない 例、 は不偏推定だが、 は不偏ではない 標準偏差の UMVU (複雑過ぎて使う人はいない) s2 s
E[s] < σ s ′ = √n − 1 Γ((n − 1)/2) √2 Γ(n/2) s 24 / 37
不偏推定量の問題点、続き 存在しない場合がある 例、正規分布の の不偏推定量は存在しない 不合理な場合がある 例、正規分布の の UMVU は負の値になる場合がある 例2、幾何分布
の の不偏推定量は、標本サイズが の場合 |μ| μ 2 p(x) = (1 − p) x p, x = 0, 1, 2, … p 1 ^ p = { 1 if x = 0 0 if x ≥ 1 25 / 37
スタインのパラドックス UMVU は不偏推定の中で最適なもの 不偏に限らなければ、より良いものが存在する場合もある 意外な例として、スタインのパラドックスがある , のとき、 の UMVU は
自身である のとき、各要素を以下のようにした推定量の方が平均二乗 誤差が常に小さいことが示されている Xi ∼ N (μi , 1) i = 1, … , n (μ1 , … , μn ) (X1 , … , Xn ) n ≥ 3 ^ μi = (1 − n − 2 ∑ n j=1 X 2 j )Xi 26 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 27 / 37
最尤推定量 尤度関数 確率質量関数または確率密度関数をパラメータ の関数と みなしたもの 対数尤度関数 最尤推定量 漸近有効性を持つ 十分統計量の関数になる 変数変換に対して不変
L(θ) θ ℓ(θ) = log L(θ) ^ θ ^ θ = arg max θ L(θ) = arg max θ ℓ(θ) 28 / 37
例 二項分布の場合 を で微分して とおくと、 従って、最尤推定量は L(p) = ( )p
x (1 − p) n−x ℓ(p) = x log p + (n − x) log(1 − p) + log ( ) n x n x ℓ(θ) p 0 x p − n − x 1 − p = x − np p(1 − p) = 0 ^ p = x/n 29 / 37
正規分布の例 とおくと、 まず を で偏微分して とおくと、 これを代入し、 で微分して とおくと、 より、
を得る。 τ = σ 2 L(μ, τ ) = n ∏ i=1 1 (2πτ )1/2 exp (− (xi − μ) 2 2τ ) ℓ(μ, τ ) = − n 2 log(2πτ ) − 1 2τ n ∑ i=1 (xi − μ) 2 ℓ(μ, τ ) μ 0 ^ μ = ¯ x τ 0 − n 2 2π 2πτ + 1 2τ 2 n ∑ i=1 (xi − ¯ x) 2 = 0 ^ τ = s 2 n 30 / 37
漸近有効性 が大きければ最尤推定量は UMVU とほぼ同じになる サイズ の標本に基づく最尤推定量を と書く 幾つかの条件の下で、 のとき以下が成り立つ 1つ目の性質を一致性と呼ぶ
2つ目は、バイアスが よりも速く減少するという意味 3つ目は、クラメル・ラオの不等式の下界に相当 n n ^ θ n n → ∞ ^ θn p → θ √n(E[ ^ θn ] − θ) → 0 nV [ ^ θ n ] → 1 I1 (θ) 1/√n 31 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 32 / 37
クラメル・ラオの不等式の一般化 クラメル・ラオの不等式 (再掲) 多次元の場合 ( とする) ここで は の共分散行列であり、 は以下で定義される
フィッシャー情報行列 また、行列 , について は が半正定値の意 V [ ^ θ] ≥ 1 In (θ) θ = (θ1 , … , θk ) V [ ^ θ] ≥ I(θ) −1 V [ ^ θ] ^ θ I(θ) Iij (θ) = E [ ∂ℓ(θ) ∂θi ∂ℓ(θ) ∂θj ] A B A ≥ B A − B 33 / 37
まとめ (前半) 点推定の最適性に関する理論について説明しました。 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 ! 不偏推定量の意味を説明できる? !
フィッシャー情報量の意味を説明できる? ! クラメル・ラオの不等式の意味を説明できる? 3. 完備十分統計量に基づく不偏推定量 34 / 37
まとめ (後半) 点推定の最適性に関する理論について説明しました。 4. 不偏推定の問題点 ! 不偏推定の問題点を説明できる? 5. 最尤推定量 !
最尤推定量の意味と漸近有効性を説明できる? 6. クラメル・ラオの不等式の一般化 35 / 37
小テスト Moodleで小テストに回答して下さい。 期限は今週中 (日曜の23:59まで) とします。 繰り返し受験して構いません。最高得点で成績をつけます。 36 / 37
期末試験 来週は期末試験 (60分) と解説 (30分) です。 鉛筆またはシャープペンシル、消しゴム を持ってきて下さい。 スマホ、ノートPC、本などの 持ち込み可
とします。 37 / 37