Upgrade to Pro — share decks privately, control downloads, hide ads and more …

oku-slide-stat2-3

 oku-slide-stat2-3

数理統計学特論II
第3回 区間推定
奥 牧人 (未病研究センター)
2022/06/29
2023/06/28
2024/06/26

Makito Oku

March 29, 2022
Tweet

More Decks by Makito Oku

Other Decks in Education

Transcript

  1. 今回の位置付け 1. 前置きと準備 2. 確率と1次元の確率変数 3. 多次元の確率変数 4. 統計量と標本分布 5.

    統計的決定理論の枠組み 6. ⼗分統計量 7. 推定論 8. 検定論 9. 区間推定 10. 正規分布、2項分布に関する推測 その他の話題 11. 線形モデル 12. ノンパラメトリック法 13. 漸近理論 14. ベイズ法 確率と統計の基礎 良い点推定とは︖ 良い検定とは︖ 問題設定と準備 7章と8章に関する証明 回帰分析と分散分析を統⼀的に理解 常⽤される⼿法を改めて整理 ベイズ統計を簡単に紹介 ノンパラを簡単に紹介 3 / 29
  2. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 6 / 29
  3. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 7 / 29
  4. 区間推定の例 正規分布の平均の区間推定について考える。 母平均 、母分散 、標本サイズ とする。 点推定 だが、 は未知なので を使って

    の標準偏 差を推定 これを の標準誤差という。 μ σ2 n ¯ X = 1 n n ∑ i=1 Xi , s 2 = 1 n − 1 n ∑ i=1 (Xi − ¯ X) 2 ¯ X ∼ N (μ, σ 2 /n) σ s ¯ X ^ σ ¯ X = s √n ¯ X 8 / 29
  5. 区間推定の例、続き %信頼区間は近似的には の範囲 意味は、母平均 を %の確率で含む区間 が大文字 (確率変数) であることに注意 信頼区間

    きちんと書くと ここで は自由度 の 分布の上側 点 95 ¯ X ± 1.96 ^ σ ¯ X μ 95 X 1 − α ¯ X ± t α/2 (n − 1)^ σ ¯ X [L(X), U (X)] = [ ¯ X − t α/2 (n − 1) s √n , ¯ X + t α/2 (n − 1) s √n ] t α/2 (n − 1) n − 1 t α/2 9 / 29
  6. 合っているか確認 実際に計算してみると P (L(X) ≤ μ ≤ U (X)) =

    P ( ¯ X − tα/2 (n − 1) s √n ≤ μ ≤ ¯ X + tα/2 (n − 1) s √n ) = P (−t α/2 (n − 1) s √n ≤ ¯ X − μ ≤ t α/2 (n − 1) s √n ) = P (−t α/2 (n − 1) ≤ √n( ¯ X − μ) s ≤ t α/2 (n − 1)) = 1 − α 10 / 29
  7. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 12 / 29
  8. 区間推定と検定の関係 以下の検定問題を考える 有意水準 の (非確率化) 検定の受容域を とおく 書き直すと [補題] 全ての

    に対して上式を満たす が存在するなら ば、以下の集合は信頼係数 の信頼域である H0 : θ = θ0 vs. H1 : θ ≠ θ0 α A(θ0 ) P (X ∉ A(θ0 ) ∣ H0 ) ≤ α P (X ∈ A(θ0 ) ∣ H0 ) ≥ 1 − α θ0 A(θ0 ) 1 − α S(X) = {θ ∣ X ∈ A(θ)} 13 / 29
  9. 証明 任意の に対して、 より となるから 従って、 は信頼係数 の信頼域である。 θ0 ∈

    Θ S(X) = {θ ∣ X ∈ A(θ)} θ0 ∈ S(X) ⇔ X ∈ A(θ0 ) P (θ0 ∈ S(X) ∣ θ = θ0 ) = P (X ∈ A(θ0 ) ∣ θ = θ0 ) ≥ 1 − α S(X) 1 − α 14 / 29
  10. 先ほどの例 両側 検定で 統計量が受容域に入ること が信頼区間に入ること が対応していた。 t t −t α/2

    (n − 1) ≤ √n( ¯ X − μ) s ≤ t α/2 (n − 1) μ ¯ X − t α/2 (n − 1) s √n ≤ μ ≤ ¯ X + t α/2 (n − 1) s √n 15 / 29
  11. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 16 / 29
  12. 信頼区間の解釈上の注意 古典的統計学では、信頼区間や信頼域が実現値の場合、信頼係数 のことを 確率と言ってはいけない ことになっている。 その理由は、母数 の値が未知ではあるものの固定値のため、 ある区間は「含む」か「含まないか」のいずれかだからである、 と通常説明される。 極端な例

    標本と関係なく確率 で母数空間全体、確率 で空集合 となる信頼域 を考える。 , のいずれが実現した場合でも、 が を含む確率は とは異なる。 1 − α θ 1 − α α S P (S = Θ) = 1 − α, P (S = ∅) = α Θ ∅ S θ 1 − α 17 / 29
  13. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 19 / 29
  14. 信頼区間の最適性 信頼区間の最適性は検定との対応関係から自然と出てくる。 不偏検定 (有意水準は ) 不偏信頼域 (信頼係数は ) α β(θ)

    ≤ α, ∀θ ∈ Θ0 β(θ) ≥ α, ∀θ ∈ Θ1 1 − α P (θ0 ∈ S(X) ∣ θ = θ0 ) ≥ 1 − α, ∀θ0 P (θ1 ∈ S(X) ∣ θ = θ0 ) ≤ 1 − α, ∀θ0 , ∀θ1 , θ0 ≠ θ1 20 / 29
  15. 信頼区間の最適性、続き 一様最強力不偏検定 ( は不偏かつ有意水準 ) 一様最強力不偏信頼域 ( は不偏かつ信頼係数 ) 真の母数以外の母数が含まれる確率が不偏の中で最小

    母数空間上の体積 (区間の場合は長さ) も不偏の中で最小 δ, δ ∗ α βδ∗ (θ) ≥ βδ (θ), ∀θ ∈ Θ1 , ∀δ S, S ∗ 1 − α P (θ1 ∈ S ∗ (X) ∣ θ = θ0 ) ≤ P (θ1 ∈ S(X) ∣ θ = θ0 ), ∀θ0 , ∀θ1 , θ0 ≠ θ1 , ∀S 21 / 29
  16. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 22 / 29
  17. 最尤推定量に基づく信頼区間 最尤推定量 の標本分布は が大きいとき以下で近似出来る ここで は のときのフィッシャー情報量 受容域 (正規分布の上側 点を

    とする) 信頼区間 ^ θ n ^ θ ⋅ ∼ N (θ, 1 nI(θ) ) I(θ) n = 1 α/2 zα/2 −zα/2 ≤ √nI(θ)( ^ θ − θ) ≤ zα/2 ^ θ − z α/2 √nI(θ) ≤ θ ≤ ^ θ + z α/2 √nI(θ) 23 / 29
  18. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 24 / 29
  19. 同時信頼域 母数が多次元の場合を考える。 信頼域を要素毎の区間 の直積で表すとする。 例、 , , なら正方形の範囲 各次元について以下が成り立つようにしておく。 全体として信頼係数

    となるよう を調節する。 θ = (θ1 , … , θk ) R1 , … , Rk S = R 1 × ⋯ × R k k = 2 R1 = [0, 1] R2 = [0, 1] P (θi ∈ Ri ) = 1 − α ′ , ∀i 1 − α α ′ 25 / 29
  20. ボンフェロニの補正 事象 について一般に以下が成り立つ これらを用いて 各 を となる事象とすれば、 従って、 とすれば良い。 実用上は多次元の信頼域より多重検定でよく使う補正

    A1 , … , Ak P (A1 ∪ ⋯ ∪ Ak ) ≤ P (A1 ) + ⋯ + P (Ak ) (A1 ∩ ⋯ ∩ Ak ) c = A c 1 ∪ ⋯ ∪ A c k P (A1 ∩ ⋯ ∩ Ak ) = 1 − P (A c 1 ∪ ⋯ ∪ A c k ) ≥ 1 − P (A c 1 ) − ⋯ − P (A c k ) Ai θi ∈ Ri P (θ ∈ S) ≥ 1 − kα ′ = 1 − α α ′ = α/k 26 / 29
  21. まとめ 区間推定の意味と検定との対応関係を説明しました。 1. 区間推定の例 ! 信頼区間の意味を説明できる? 2. 信頼域の構成法 ! 信頼区間や信頼域と検定の対応関係を説明できる?

    3. 信頼区間の解釈 ! 信頼区間の解釈上の注意点を説明できる? 4. 信頼区間の最適性 ! 一様最強力不偏信頼域の意味を説明できる? 5. 最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 27 / 29