Upgrade to Pro — share decks privately, control downloads, hide ads and more …

oku-slide-stat1-6

 oku-slide-stat1-6

数理統計学特論I
第6回 十分統計量
奥 牧人 (未病研究センター)
2022/05/25
2023/05/24
2024/05/22

Makito Oku

March 29, 2022
Tweet

More Decks by Makito Oku

Other Decks in Education

Transcript

  1. 今回の位置付け 1. 前置きと準備 2. 確率と1次元の確率変数 3. 多次元の確率変数 4. 統計量と標本分布 5.

    統計的決定理論の枠組み 6. ⼗分統計量 7. 推定論 8. 検定論 9. 区間推定 10. 正規分布、2項分布に関する推測 その他の話題 11. 線形モデル 12. ノンパラメトリック法 13. 漸近理論 14. ベイズ法 確率と統計の基礎 良い点推定とは︖ 良い検定とは︖ 問題設定と準備 7章と8章に関する証明 回帰分析と分散分析を統⼀的に理解 常⽤される⼿法を改めて整理 ベイズ統計を簡単に紹介 ノンパラを簡単に紹介 3 / 27
  2. 十分統計量 例えば、正規分布の母平均 と母分散 を推定したいとする。 このとき、標本平均 と標本分散 の2つだけ分かれば十分で あり、個々の の値は無視しても ,

    の推定には影響がなさ そうである。 [十分統計量の定義] 個の統計量 がパラメー タ に関する 次元の十分統計量であるとは、 を与えたとき の の条件付き分布が に依存しないことで ある。 μ σ 2 ¯ X s 2 Xi μ σ 2 k T = (T1 , … , Tk ) θ k T X = (X1 , … , Xn ) θ 8 / 27
  3. 例 とする。 統計量 について考える。 直感的には が分かればパラメータ に関する情報としては 十分と考えられる。実際に条件付き確率を計算すると、 となり、確かに に依存していないことが分かる。

    X1 , … , Xn i.i.d. ∼ Bin(1, p) Y = ∑ n i=1 Xi Y p p(x1 , … , xn |y) = p(x1 , … , xn , y) p(y) = p(x1 , … , xn ) p(y) = p y (1 − p) n−y ( )py (1 − p)n−y = ( ) −1 n y n y p 9 / 27
  4. 分解定理 より簡単に十分統計量であることを示す方法がある。 [分解定理] 統計量 がパラメータ の十分統計量であるための 必要十分条件は、 の確率質量関数または確率 密度関数 が

    の形に分解出来ることである。ただし は を含まない。 でも良い。先ほどの例でいうと、 T θ X = (X1 , … , Xn ) p(x) p(x) = g(T , θ)h(x) h(x) θ h(x) = 1 p(x) = p y (1 − p) n−y = g(y, p) × 1 10 / 27
  5. 正規分布の例 のとき 従って、 とおけば は十分統計量 (この場合も ) X1 , …

    , Xn i.i.d. ∼ N (μ, σ2 ) p(x) = n ∏ i=1 ( 1 √2πσ exp (− (xi − μ) 2 2σ2 )) = 1 (2π)n/2 σn exp (− n(¯ x − μ) 2 2σ2 − ∑ n i=1 (xi − ¯ x) 2 2σ2 ) T1 = ¯ X, T2 = n ∑ i=1 (Xi − ¯ X) 2 T = (T1 , T2 ) h(x) = 1 11 / 27
  6. の例 のとき ここで とみなせば、 が十分統計量 h(x) ≠ 1 X1 ,

    … , Xn i.i.d. ∼ P o(λ) p(x) = n ∏ i=1 e−λ λxi xi ! = e −nλ λ ∑ n i=1 xi ( n ∏ i=1 xi !) −1 g(T , λ) = e −nλ λ ∑ n i=1 x i h(x) = ( n ∏ i=1 xi !) −1 T = ∑ n i=1 xi 12 / 27
  7. 証明 を書き直すと ただし、2行目で期待値の繰り返しの公式と を使っ た R(δ, θ) E[(δ − θ)

    2 ] = E[(δ − δ ∗ + δ ∗ − θ) 2 ] = E[(δ − δ ∗ ) 2 ] + E[(δ ∗ − θ) 2 ] + 0 ≥ E[(δ ∗ − θ) 2 ] = R(δ ∗ , θ) E[δ|T ] = δ ∗ E[(δ − δ ∗ )(δ ∗ − θ)] = E T [E[(δ − δ ∗ )(δ ∗ − θ)|T ]] = E T [(δ ∗ − θ)E[(δ − δ ∗ )|T ]] = 0 16 / 27
  8. 指数型分布族 指数型分布族 指数分布とは無関係 分解定理より は十分統計量 を自然母数と呼ぶ [定理] の属する母数空間が 次元ユークリッド空間の開集合 であり、

    の共分散行列が正則のとき、 は完備である。 p(x, ψ) = h(x) exp ( k ∑ j=1 ψj Tj (x) − c(ψ)) T = (T 1 , … , T k ) ψ = (ψ1 , … , ψk ) ψ k T T 19 / 27
  9. 例 2項分布を指数型分布族の形に変形する 指数型分布族 (再掲) この場合 で、 , に対応 従って、 は完備十分統計量

    ( )p x (1 − p) n−x = ( ) exp (x log p 1 − p + n log(1 − p)) n x n x p(x, ψ) = h(x) exp ( k ∑ j=1 ψj Tj (x) − c(ψ)) k = 1 ψ1 = log(p/(1 − p)) T1 (x) = x x 20 / 27
  10. 正規分布の例 のとき 従って、 , は完備十分統計量 X1 , … , Xn

    i.i.d. ∼ N (μ, σ2 ) p(x) = n ∏ i=1 ( 1 √2πσ exp (− (xi − μ) 2 2σ2 )) = 1 (2π)n/2 σn exp (− ∑ n i=1 x 2 i 2σ2 + μ ∑ n i=1 xi σ2 − nμ 2 2σ2 ) = exp (− ∑ n i=1 x 2 i 2σ2 + μ ∑ n i=1 xi σ2 − nμ 2 2σ2 − n 2 log(2πσ 2 )) T1 (x) = ∑ xi T2 = ∑ x 2 i 21 / 27
  11. 最小十分統計量 例えば、コインを 回投げ、前半の 回の表の数を , 後半の 回の表の数を とする。 は十分統計量だが、 だけで十分

    十分統計量 が以下の性質を満たすなら、弱い意味で最小十分 が十分統計量 が 対 (単射) 十分性を失うことなく の情報を縮約することが出来ない 十分統計量 が以下の性質を満たすなら、強い意味で最小十分 任意の十分統計量 に対して となる が存在 任意の十分統計量の情報を に縮約出来る 2n n Y1 n Y2 (Y1 , Y2 ) Y = Y1 + Y2 T U = g(T ) ⇒ g 1 1 T T S T = h(S) h T 23 / 27