Upgrade to Pro — share decks privately, control downloads, hide ads and more …

oku-slide-stat1-2

 oku-slide-stat1-2

数理統計学特論I
第2回 確率と1次元の確率変数
奥 牧人 (未病研究センター)
2022/04/20
2023/04/26
2024/04/24

Makito Oku

March 29, 2022
Tweet

More Decks by Makito Oku

Other Decks in Education

Transcript

  1. 今回の位置付け 1. 前置きと準備 2. 確率と1次元の確率変数 3. 多次元の確率変数 4. 統計量と標本分布 5.

    統計的決定理論の枠組み 6. ⼗分統計量 7. 推定論 8. 検定論 9. 区間推定 10. 正規分布、2項分布に関する推測 その他の話題 11. 線形モデル 12. ノンパラメトリック法 13. 漸近理論 14. ベイズ法 確率と統計の基礎 良い点推定とは︖ 良い検定とは︖ 問題設定と準備 7章と8章に関する証明 回帰分析と分散分析を統⼀的に理解 常⽤される⼿法を改めて整理 ベイズ統計を簡単に紹介 ノンパラを簡単に紹介 3 / 40
  2. 連続変数の問題点 連続変数の場合、 は常に となってしまう。 例、 の一様分布で の場合 0 1 x

    2ε P (X = x) 0 [0, 1] x ∈ (0, 1) P (X = x) = lim ε→0 P (x − ε ≤ X ≤ x + ε) = lim ε→0 2ε = 0 10 / 40
  3. 連続変数の場合 確率密度関数 (密度関数) 満たすべき性質 累積分布関数 (分布関数) が成り立つ。 p(x) = lim

    ε→0 P (x ≤ X ≤ x + ε) ε p(x) ≥ 0, ∀x ∫ ∞ −∞ p(x)dx = 1 F (x) = P (X ≤ x) p(x) = F ′ (x) 11 / 40
  4. どうしてこれが平均なのか? 標本平均 の取り得る値を とし、それぞれの出現回数を とおく。 個の を同じ値ごとにまとめる。 ¯ x =

    x1 + ⋯ + xn n = 1 n n ∑ i=1 xi X a1 , … , aK n1 , … , nK n xi 1 n n ∑ i=1 xi = 1 n K ∑ k=1 nk ak = K ∑ k=1 nk n ak → K ∑ k=1 p(ak )ak , (n → ∞) 15 / 40
  5. 期待値と分散の性質 常に成り立つ式 ( は定数) と が独立のときのみ成り立つ式 a, b V [X]

    = E[X 2 ] − E[X] 2 E[aX + b] = aE[X] + b V [aX + b] = a 2 V [X] E[X + Y ] = E[X] + E[Y ] X Y E[XY ] = E[X]E[Y ] V [X + Y ] = V [X] + V [Y ] 18 / 40
  6. モーメント (積率) 原点まわりの 次のモーメント 平均値まわりの 次のモーメント 次の標準化モーメント 平均値は , 分散は

    歪度 (skewness) は , 尖度 (kurtosis) は k μ ′ k = E[X k ] k μk = E[(X − μ) k ] k αk = E [( X − μ σ ) k ] μ ′ 1 μ2 α3 α4 19 / 40
  7. パーセント点 上側 %点、下側 %点など 累積分布関数の逆関数が一意に決まる場合は簡単 一意に決まらない場合も含めて、以下で定義 例、 の中央値は 5 5

    x(α) = F −1 (α), α ∈ (0, 1) x(α) = F −1 L (α) + F −1 R (α) 2 , α ∈ (0, 1) F −1 L (α) = min{x|P (X ≤ x) ≥ α} F −1 R (α) = max{x|P (X ≥ x) ≥ 1 − α} {1, 2, 3, 4} (2 + 3)/2 = 2.5 20 / 40
  8. 母関数と特性関数 確率母関数 ( は非負の整数、 とする) 積率母関数 ( は連続変数) 特性関数 (

    は離散と連続どちらでも良い、 は虚数単位) これらは元の確率分布と1対1に対応しており、これらを使うこと で計算が簡単になる場合がある。 例、平均と分散の計算、畳み込み、収束性の証明など X |s| ≤ 1 G(s) = E[s X ] X ϕ(θ) = E[e θX ] X i ϕ(t) = E[e itX ] 23 / 40
  9. 母関数の性質 確率母関数を で 回微分し、 を代入して で割る 確率母関数を で 回微分し、 を代入する

    積率母関数を で 回微分し、 を代入する s k s = 0 k! G (k) (0)/k! = p(k) s k s = 1 G (k) (1) = E[X(X − 1) ⋯ (X − k + 1)] θ k θ = 0 ϕ (k) (0) = E[X k ] = μ ′ k 24 / 40
  10. 特性関数の性質 離散変数の場合 連続変数の場合、 という条件下で、以下が成り立つ p(x) = 1 2π ∫ π

    −π e −itx ϕ(t)dt ∫ ∞ −∞ |ϕ(t)|dt < ∞ p(x) = 1 2π ∫ ∞ −∞ e −itx ϕ(t)dt 25 / 40
  11. 計算の例 2項分布の確率母関数 平均は 分散は を用いて G(s) = n ∑ k=0

    s k ( )p k (1 − p) n−k = n ∑ x=0 ( )(sp) k (1 − p) n−k = (sp + 1 − p) n n k n k G ′ (1) = E[X] = np G ′′ (1) = E[X(X − 1)] = n(n − 1)p 2 V [X] = E[X 2 ] − E[X] 2 = E[X(X − 1)] + E[X] − E[X] 2 = n(n − 1)p 2 + np − (np) 2 = np(1 − p) 28 / 40
  12. 超幾何分布 個の中から最初に 個、続いて 個を復元抽出するとき、 重複して選ばれる個数 が従う分布 確率質量関数 期待値と分散 N n1

    n2 X p(k) = ( ) ( ) ( ) n2 k N − n2 n1 − k N n1 E[X] = n1 n2 N V [X] = n1 n2 (N − n1 )(N − n2 ) N 2 (N − 1) 32 / 40
  13. 一様分布 範囲内で確率密度が一定の分布 確率密度関数 ( とする) 期待値と分散 a < b p(x)

    = { 1/(b − a) if x ∈ [a, b] 0 otherwise E[X] = a + b 2 V [X] = (b − a) 2 12 33 / 40
  14. 正規分布 確率密度関数 ( とする) 期待値と分散 標準正規分布 ( , ) の場合

    σ > 0 f(x) = 1 √2πσ exp (− (x − μ) 2 2σ2 ) E[X] = μ V [X] = σ 2 μ = 0 σ = 1 f(x) = ϕ(x) = 1 √2π e −x 2 /2 34 / 40
  15. ガンマ分布 ガンマ関数 ( とする) ガンマ関数は を満たす 確率密度関数 ( とする) 指数分布

    ( の場合) を特殊な場合として含む 期待値と分散 a > 0 Γ(a) = ∫ ∞ 0 x a−1 e −x dx Γ(n) = (n − 1)! x, ν, α > 0 f(x) = x ν−1 e −x/α αν Γ(ν) ν = 1 E[X] = να, V [X] = να 2 35 / 40
  16. ベータ分布 ベータ関数 ベータ関数は を満たす 確率密度関数 ( とする) 期待値と分散 B(a, b)

    = ∫ 1 0 x a−1 (1 − x) b−1 dx B(a, b) = Γ(a)Γ(b)/Γ(a + b) x ∈ (0, 1) f(x) = x a−1 (1 − x) b−1 B(a, b) E[X] = a a + b , V [X] = ab (a + b)2(a + b + 1) 36 / 40
  17. 分布間の関係 2項分布 正規分布 ( を固定して ) 2項分布 ポアソン分布 ( を固定して

    ) 幾何分布 (離散) と指数分布 (連続) が対応 ガンマ分布 分布 ガンマ分布とベータ分布は、 分布と 分布の導出に使う 紛らわしいもの 2項分布 負の2項分布 幾何分布 超幾何分布 幾何分布 負の2項分布 → p n → ∞ → np n → ∞ ⊃ χ 2 t F ⊄ ⊄ ⊂ 37 / 40
  18. まとめ 確率に関する基本用語や主な1次元分布の意味を説明しました。 1. 確率と確率変数 2. 確率変数の期待値と分布の特性値 ! 期待値と分散の式を書ける? 3. 母関数

    ! 母関数と特性関数の意味を説明できる? 4. 主な1次元分布 ! 2項分布と正規分布の式を書ける? ! 主な1次元分布の式の意味を説明できる? 38 / 40