Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
oku-slide-stat1-7
Search
Makito Oku
March 29, 2022
Education
0
270
oku-slide-stat1-7
数理統計学特論I
第7回 推定論
奥 牧人 (未病研究センター)
2022/06/01
2023/05/31
2024/05/29
Makito Oku
March 29, 2022
Tweet
Share
More Decks by Makito Oku
See All by Makito Oku
oku-slide-20240802
okumakito
0
67
oku-slide-20231129
okumakito
0
99
oku-slide-20230827
okumakito
0
110
oku-slide-20230213
okumakito
0
210
oku-slide-20221212
okumakito
0
75
oku-slide-20221129
okumakito
0
140
oku-slide-20221115
okumakito
0
290
oku-slide-20220820
okumakito
0
260
oku-slide-stat1-1
okumakito
0
270
Other Decks in Education
See All in Education
MLH Hackcon: Keynote (2024)
theycallmeswift
0
180
2409_CompanyInfo_Hanji_published.pdf
yosukemurata
0
230
"数学" をプログラミングしてもらう際に気をつけていること / Key Considerations When Programming "Mathematics"
guvalif
0
540
世界のオープンソースロボットたち #1
shiba_8ro
0
130
week15@tcue2024
nonxxxizm
0
560
技術を楽しもう/enjoy_engineering
studio_graph
1
400
Introduction - Lecture 1 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.7k
A question of time
ange
0
930
Design Guidelines and Models - Lecture 5 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
660
week@tcue2024
nonxxxizm
0
510
NTTコムウェアの東海支店でもアジャイル人材育てんとかんやん!結果どえらい人材が育ったがね!
mizuki_fujita
0
600
XML and Related Technologies - Lecture 7 - Web Technologies (1019888BNR)
signer
PRO
0
2.5k
Featured
See All Featured
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
228
52k
Measuring & Analyzing Core Web Vitals
bluesmoon
1
40
Why Our Code Smells
bkeepers
PRO
334
57k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
27
790
Fashionably flexible responsive web design (full day workshop)
malarkey
404
65k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
31
2.7k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.6k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
126
18k
How to Ace a Technical Interview
jacobian
275
23k
Done Done
chrislema
181
16k
The Invisible Side of Design
smashingmag
297
50k
Transcript
数理統計学特論I 第7回 推定論 奥 牧人 (未病研究センター) 2024/05/29 1 / 37
前回の復習 前回の目的 十分統計量とその関連用語の意味を理解すること 前回の達成目標 十分統計量の意味を説明できる。 十分統計量の分解定理を説明できる。 ラオ・ブラックウェルの定理を説明できる。 完備十分統計量の意味を説明できる。 2 /
37
今回の位置付け 1. 前置きと準備 2. 確率と1次元の確率変数 3. 多次元の確率変数 4. 統計量と標本分布 5.
統計的決定理論の枠組み 6. ⼗分統計量 7. 推定論 8. 検定論 9. 区間推定 10. 正規分布、2項分布に関する推測 その他の話題 11. 線形モデル 12. ノンパラメトリック法 13. 漸近理論 14. ベイズ法 確率と統計の基礎 良い点推定とは︖ 良い検定とは︖ 問題設定と準備 7章と8章に関する証明 回帰分析と分散分析を統⼀的に理解 常⽤される⼿法を改めて整理 ベイズ統計を簡単に紹介 ノンパラを簡単に紹介 3 / 37
今回の目的と達成目標 目的 点推定の最適性に関する理論について理解すること 達成目標 不偏推定量の意味を説明できる。 フィッシャー情報量の意味を説明できる。 クラメル・ラオの不等式の意味を説明できる。 不偏推定の問題点を説明できる。 最尤推定量の意味と漸近有効性を説明できる。 4
/ 37
予習用キーワードの確認 不偏推定 尤度関数 5 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 6 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 7 / 37
推定における記法と設定 推定では、決定関数 のことを または単に と書き、 推定量と呼ぶ リスク関数として平均二乗誤差を使う バイアス-バリアンス分解 (ここだけ とおく)
をバイアスと呼ぶ δ(X) ^ θ(X) ^ θ R(θ, ^ θ) = E[( ^ θ − θ) 2 ] E[ ^ θ] = μ E[( ^ θ − θ) 2 ] = E[( ^ θ − μ + μ − θ) 2 ] = E[( ^ θ − μ) 2 ] + E[(μ − θ) 2 ] + 0 = V [ ^ θ] + (μ − θ) 2 μ − θ 8 / 37
バイアスとバリアンス 母集団から標本を抽出して を計算、を何度も行うとする。 バリアンス は、推定値のバラツキの大きさを表す。 バイアス は、推定値の平均と真の値のズレを表す。 ^ θ V
[ ^ θ] E[ ^ θ] − θ 9 / 37
不偏推定量 が不偏推定量であるとは、以下が成り立つこと 例、不偏分散 (参考) 最尤推定の場合 ^ θ E[ ^ θ]
= θ, ∀θ s 2 = 1 n − 1 n ∑ i=1 (Xi − ¯ X) 2 s 2 n = 1 n n ∑ i=1 (Xi − ¯ X) 2 10 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 11 / 37
一様最小分散不偏推定量 不偏推定の場合、平均二乗誤差は分散 のみになる 従って、不偏推定量の中では、分散が最小となるものが最適 一様最小分散不偏推定量 (Uniformly Minimum Variance Unbiaced estimator,
略して UMVU と書く) 不偏推定量 が UMVU であるとは、任意の不偏推定量 に 対して以下が成り立つこと V [ ^ θ] E[( ^ θ − θ) 2 ] = V [ ^ θ] ^ θ ∗ ^ θ V [ ^ θ ∗ ] ≤ V [ ^ θ], ∀θ 12 / 37
話の流れを整理 不偏推定量 UMVU (不偏の中で最適) UMVU であることを示す方法 1. クラメル・ラオの不等式を使う方法 (フィッシャー情報量 を含む)
2. 完備十分統計量を使う方法 最尤推定量 13 / 37
フィッシャー情報量 の確率質量関数または確率密度関数 を、パラメータ を明示して と書く フィッシャー情報量 対数尤度関数 とし、 と書け ば、以下のように略記できる
の場合 が成り立つ X = (X1 , … , Xn ) p(x) θ f(x, θ) In (θ) = E [( ∂ ∂θ log f(x, θ)) 2 ] ℓ(θ) = log f(x, θ) ℓ ′ (θ) = ∂ℓ(θ)/∂θ In (θ) = E[ℓ ′ (θ) 2 ] X1 , … , Xn i.i.d. ∼ F In (θ) = nI1 (θ) 14 / 37
クラメル・ラオの不等式 クラメル・ラオの不等式 ( は不偏推定量) ただし、 と、微分と積分が交換可能なこと (正則条件) を仮定 [定理] クラメル・ラオの不等式が成り立つ場合、不偏推定量
が以下を満たせば UMVU である ^ θ V [ ^ θ] ≥ 1 In (θ) In (θ) > 0 ^ θ ∗ V [ ^ θ ∗ ] = 1 In (θ) , ∀θ 15 / 37
例 の の推定量 について計算 の確率密度関数 ( より 個分で良い) 対数尤度関数 で偏微分
X1 , … , Xn i.i.d. ∼ N (μ, σ2 ) μ ¯ X Xi In (θ) = nI1 (θ) 1 f(xi , μ) = 1 √2πσ exp (− (xi − μ) 2 2σ2 ) ℓ(μ) = log f(xi , μ) = − (xi − μ)2 2σ2 − 1 2 log(2πσ 2 ) μ ℓ ′ (μ) = ∂ ∂μ ℓ(μ) = xi − μ σ2 16 / 37
例、続き フィッシャー情報量 クラメル・ラオの不等式の下界は、 これは に一致するので、 は確かに UMVU である。 I1 (μ)
= E[ℓ ′ (μ) 2 ] = E [ (Xi − μ) 2 σ4 ] = 1 σ2 1 In (μ) = 1 nI1 (μ) = σ2 n V [ ¯ X] ¯ X ¯ X ∼ N (μ, σ2 n ) 17 / 37
分散は? クラメル・ラオの不等式では不偏分散 が UMVU であることを 示せない UMVU なのだが、下界を達成しない 次に紹介する別の方法で証明する s
2 18 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 19 / 37
完備十分統計量とUMVU [定理] 完備十分統計量 の関数である不偏推定量 は一意に定ま り UMVU となる。 また、任意の不偏推定量を とするとき
は に一致 する。 T ^ θ∗ (T ) ^ θ E[ ^ θ|T ] ^ θ∗ (T ) 20 / 37
証明 完備統計量の関数となる不偏推定量は一意であることを示す , を不偏推定量とし、 とおけば なので、完備性の定義より 続いて、任意の不偏推定量 に対して、 を完備十分とし を作ると、不偏となるので一意に定まる。
は十分統計量なので ラオ・ブラックウェルの定理を適用すれば ^ θ 1 ^ θ 2 g(T ) = ^ θ 1 (T ) − ^ θ 2 (T ) E[g(T )] = θ − θ = 0, ∀θ ^ θ1 (T ) ≡ ^ θ2 (T ) ^ θ T ^ θ ∗ (T ) = E[ ^ θ|T ] T V [ ^ θ ∗ ] ≤ V [ ^ θ], ∀θ 21 / 37
例 母集団が正規分布 のとき、以下は完備十分統計量 , は完備十分統計量 の関数の形をしている , は不偏である 従って、 ,
は UMVU である N (μ, σ 2 ) T1 = n ∑ i=1 Xi , T2 = n ∑ i=1 X 2 i ¯ X s 2 T = (T1 , T2 ) ¯ X = T1 n , s 2 = T2 − T 2 1 /n n − 1 ¯ X s 2 E[ ¯ X] = μ, E[s 2 ] = σ 2 ¯ X s 2 22 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 23 / 37
不偏推定の問題点 母数の変換に対して不変ではない 例、 は不偏推定だが、 は不偏ではない 標準偏差の UMVU (複雑過ぎて使う人はいない) s2 s
E[s] < σ s ′ = √n − 1 Γ((n − 1)/2) √2 Γ(n/2) s 24 / 37
不偏推定量の問題点、続き 存在しない場合がある 例、正規分布の の不偏推定量は存在しない 不合理な場合がある 例、正規分布の の UMVU は負の値になる場合がある 例2、幾何分布
の の不偏推定量は、標本サイズが の場合 |μ| μ 2 p(x) = (1 − p) x p, x = 0, 1, 2, … p 1 ^ p = { 1 if x = 0 0 if x ≥ 1 25 / 37
スタインのパラドックス UMVU は不偏推定の中で最適なもの 不偏に限らなければ、より良いものが存在する場合もある 意外な例として、スタインのパラドックスがある , のとき、 の UMVU は
自身である のとき、各要素を以下のようにした推定量の方が平均二乗 誤差が常に小さいことが示されている Xi ∼ N (μi , 1) i = 1, … , n (μ1 , … , μn ) (X1 , … , Xn ) n ≥ 3 ^ μi = (1 − n − 2 ∑ n j=1 X 2 j )Xi 26 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 27 / 37
最尤推定量 尤度関数 確率質量関数または確率密度関数をパラメータ の関数と みなしたもの 対数尤度関数 最尤推定量 漸近有効性を持つ 十分統計量の関数になる 変数変換に対して不変
L(θ) θ ℓ(θ) = log L(θ) ^ θ ^ θ = arg max θ L(θ) = arg max θ ℓ(θ) 28 / 37
例 二項分布の場合 を で微分して とおくと、 従って、最尤推定量は L(p) = ( )p
x (1 − p) n−x ℓ(p) = x log p + (n − x) log(1 − p) + log ( ) n x n x ℓ(θ) p 0 x p − n − x 1 − p = x − np p(1 − p) = 0 ^ p = x/n 29 / 37
正規分布の例 とおくと、 まず を で偏微分して とおくと、 これを代入し、 で微分して とおくと、 より、
を得る。 τ = σ 2 L(μ, τ ) = n ∏ i=1 1 (2πτ )1/2 exp (− (xi − μ) 2 2τ ) ℓ(μ, τ ) = − n 2 log(2πτ ) − 1 2τ n ∑ i=1 (xi − μ) 2 ℓ(μ, τ ) μ 0 ^ μ = ¯ x τ 0 − n 2 2π 2πτ + 1 2τ 2 n ∑ i=1 (xi − ¯ x) 2 = 0 ^ τ = s 2 n 30 / 37
漸近有効性 が大きければ最尤推定量は UMVU とほぼ同じになる サイズ の標本に基づく最尤推定量を と書く 幾つかの条件の下で、 のとき以下が成り立つ 1つ目の性質を一致性と呼ぶ
2つ目は、バイアスが よりも速く減少するという意味 3つ目は、クラメル・ラオの不等式の下界に相当 n n ^ θ n n → ∞ ^ θn p → θ √n(E[ ^ θn ] − θ) → 0 nV [ ^ θ n ] → 1 I1 (θ) 1/√n 31 / 37
Outline 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 3. 完備十分統計量に基づく不偏推定量 4. 不偏推定の問題点 5.
最尤推定量 6. クラメル・ラオの不等式の一般化 32 / 37
クラメル・ラオの不等式の一般化 クラメル・ラオの不等式 (再掲) 多次元の場合 ( とする) ここで は の共分散行列であり、 は以下で定義される
フィッシャー情報行列 また、行列 , について は が半正定値の意 V [ ^ θ] ≥ 1 In (θ) θ = (θ1 , … , θk ) V [ ^ θ] ≥ I(θ) −1 V [ ^ θ] ^ θ I(θ) Iij (θ) = E [ ∂ℓ(θ) ∂θi ∂ℓ(θ) ∂θj ] A B A ≥ B A − B 33 / 37
まとめ (前半) 点推定の最適性に関する理論について説明しました。 1. 点推定論の枠組み 2. 不偏推定量とフィッシャー情報量 ! 不偏推定量の意味を説明できる? !
フィッシャー情報量の意味を説明できる? ! クラメル・ラオの不等式の意味を説明できる? 3. 完備十分統計量に基づく不偏推定量 34 / 37
まとめ (後半) 点推定の最適性に関する理論について説明しました。 4. 不偏推定の問題点 ! 不偏推定の問題点を説明できる? 5. 最尤推定量 !
最尤推定量の意味と漸近有効性を説明できる? 6. クラメル・ラオの不等式の一般化 35 / 37
小テスト Moodleで小テストに回答して下さい。 期限は今週中 (日曜の23:59まで) とします。 繰り返し受験して構いません。最高得点で成績をつけます。 36 / 37
期末試験 来週は期末試験 (60分) と解説 (30分) です。 鉛筆またはシャープペンシル、消しゴム を持ってきて下さい。 スマホ、ノートPC、本などの 持ち込み可
とします。 37 / 37