Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
確率分布の紹介
Search
funain
November 06, 2020
Education
0
810
確率分布の紹介
確率分布に慣れ親しめるように, コイン投げのベルヌーイ分布からスタートして色々な確率分布との関連性を解説しています.
funain
November 06, 2020
Tweet
Share
More Decks by funain
See All by funain
第3回 クイズ大会 問題
funain
0
83
第3回 クイズ大会 解答
funain
0
83
第2回 クイズ大会 問題
funain
0
140
第2回 クイズ大会 解答
funain
0
120
2023年度にやりたいこと(めぐろLT会 #2)
funain
0
520
スクリーニング評価の注意点
funain
0
740
第1回 クイズ大会 問題
funain
0
1.2k
第1回 クイズ大会 解答
funain
0
250
フェアな比較を崩すもの ~交絡と効果修飾~ / Confounding EffectModification
funain
1
530
Other Decks in Education
See All in Education
いにしえの国産データベース~桐~って知っていますか?
masakiokuda
2
140
Data Processing and Visualisation Frameworks - Lecture 6 - Information Visualisation (4019538FNR)
signer
PRO
1
2.3k
Ilman kirjautumista toimivia sovelluksia
matleenalaakso
1
20k
女子商アプリ開発の軌跡
asial_edu
0
340
Analysis and Validation - Lecture 4 - Information Visualisation (4019538FNR)
signer
PRO
0
2k
今も熱いもの!魂を揺さぶる戦士の儀式:マオリ族のハカ
shubox
0
110
系統性を意識したプログラミング教育~ガチャを実装しよう~
asial_edu
0
360
(元)教育担当がお伝えする、若手社員が成長しまくるOJTポイント
masakiokuda
0
270
新人研修の課題と未来を考える
natsukokanda1225
0
1.7k
Avoin jakaminen ja Creative Commons -lisenssit
matleenalaakso
0
1.8k
Information Architectures - Lecture 2 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.5k
R6愛南町事前復興フォーラムリーフレット
bousaichiribu
0
240
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
227
22k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
The Cost Of JavaScript in 2023
addyosmani
49
7.7k
Designing Experiences People Love
moore
141
24k
StorybookのUI Testing Handbookを読んだ
zakiyama
29
5.6k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Producing Creativity
orderedlist
PRO
344
40k
The Cult of Friendly URLs
andyhume
78
6.3k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
32
5.4k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
135
33k
Transcript
確率分布の紹介 2020/11/06
統計学の基本的な考え方 • データは真の分布から生成されているとする(大前提) • データや知識から真の分布を推測していく • 真の分布は, きっとこのような分布であろうと人間が想定して作成し, 推論に使うのが, 統計モデル(確率モデル)
• モデルの組み方のセッティングの違いが頻度論とベイズで異なる • どちらにしても, 統計モデルは確率論の言葉で表現される ⇒ 確率分布に親しむことが統計学の理解の第一歩 ⇒ コイン投げから, 色々な確率分布との関連性を確認していく
図解 : 統計学の基本的な考え方 統計モデル 頻度論, ベイズ 推論 解釈, 予測 真の分布
データ生成 評価 AIC, BIC, WAIC, WBIC, MSE
ベルヌーイ分布 : () ◼モデリングの対象事例 • コイン投げで表が出るか裏が出るか • ある患者が, 死亡・発症などイベントを起こすか否か ◼確率関数
= = ∗ 1 − 1− = 0,1
二項分布 : (, ) ◼モデリングの対象事例 • 枚のコインを投げて, 表が出た枚数は何枚か • 人の患者のうち,
死亡などイベントを起こしたのは何人か ◼確率関数 = = ∗ ∗ 1 − − = 0,1,2, … ,
ベータ分布 : (, ) ◼モデリングの対象事例 • ベルヌーイ分布や二項分布のpのモデリング • 一様乱数(0,1)を +
個生成して, 小さい順に並べたときの前から 番目, 後ろから + 1番目の数が従う分布 ◼確率密度関数 = 1 (, ) −1 ∗ 1 − −1 0 < < 1 ◼ちなみに • 二項分布とベータ分布の関係は多項分布とディリクレ分布の関係と同様
ポアソン分布 : () ◼モデリングの対象事例 • プロイセン陸軍で馬に蹴られて死亡した兵士数 • 一日に緊急入院した患者の人数 ◼確率関数 =
= − ! = 0,1,2, … ◼ちなみに • を増やして、確率を各試行に対してでなくて、微小な時間に対し て与えるイメージ(⇒ ハザード) • 総頻度で条件付けした、独立なポアソン分布の同時分布は多項分布
◼モデリングの対象事例 • 平均1/分に一本やってくる列車が到着するまでの時間 • 病院の受付の待ち時間 ◼確率密度関数 = ∗ − 0
< < ∞ ◼ちなみに • 指数分布とポアソン分布は表と裏の関係 • ある期間に平均回起こるイベントに対して, 何回発生したかが ポアソン分布, 起こるまでにどのくらいかかったが指数分布 指数分布 : ()
ガンマ分布 : (, ) ◼モデリングの対象事例 • 平均1/分に一本やってくる列車が本到着するまでの時間 • 保険金の支払額 ◼確率密度関数
= Γ() ∗ −1− 0 < < ∞ ◼ちなみに • 独立な指数分布に従う確率変数の和の分布はガンマ分布 • この関係は幾何分布と負の二項分布の関係と同様 • カイ二乗分布はガンマ分布の一種
◼モデリングの対象事例 • 部品や人の寿命や故障までの時間 • がん薬物療法の全生存期間(OS)や無増悪生存期間(PFS) ◼確率密度関数 = ∗ ∗ −1
∗ − 0 < < ∞ ◼ちなみに • 指数分布はハザードが一定(どの時間でもイベントが起きる確率 は不変であったが, ワイブル分布はハザードが時間によって変化 • = 1とすれば指数分布になる ワイブル分布 : (, )
関係性のまとめ ベルヌーイ分布 多項分布 ディリクレ分布 ベータ分布 一様分布 ポアソン分布 指数分布 ガンマ分布 ワイブル分布
カイ二乗分布 正規分布 二項分布 複数化 複数化 複数化 ハザード拡張 特殊化 回数と時間 極限 極限 確率の分布 確率の分布 順序の分布 マハラノビクス距離 条件付き同時分布
おまけ • ガウス積分 : −∞ ∞ − − 2
= • ガンマ関数 : Γ = 0 ∞ −1− • ベータ関数 : , = 0 1 −1 1 − −1 = Γ Γ() Γ(+) • スターリングの公式 : ! ≈ 2 • 上の四つの数式が読めると数理統計の見通しがよくなる • 確率分布を特徴づけるパラメータを母数とも呼ぶが, サンプルの数を母数と呼ぶのは誤 用(おそらく, 分母という言葉に引き摺られている)なので, 使わないようにしましょう • サンプルサイズとサンプル数という言葉もややこしいので, 気を付けましょう
参考になるオンライン資料 • 数学カフェ 確率・統計・機械学習回 「速習 確率・統計」 https://www.slideshare.net/matsukenbook/rev012 • 色々な確率分布とその応用 https://www.slideshare.net/hirokiiida165/ss-78477986
• 渡辺澄夫先生のデータ解析の講義資料 http://watanabe-www.math.dis.titech.ac.jp/users/swatanab/da2019.html
おしまい