Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
確率分布の紹介
Search
funain
November 06, 2020
Education
1k
0
Share
確率分布の紹介
確率分布に慣れ親しめるように, コイン投げのベルヌーイ分布からスタートして色々な確率分布との関連性を解説しています.
funain
November 06, 2020
More Decks by funain
See All by funain
第3回 クイズ大会 問題
funain
0
130
第3回 クイズ大会 解答
funain
0
130
第2回 クイズ大会 問題
funain
0
200
第2回 クイズ大会 解答
funain
0
170
2023年度にやりたいこと(めぐろLT会 #2)
funain
0
600
スクリーニング評価の注意点
funain
0
860
第1回 クイズ大会 問題
funain
0
2.3k
第1回 クイズ大会 解答
funain
0
310
フェアな比較を崩すもの ~交絡と効果修飾~ / Confounding EffectModification
funain
1
620
Other Decks in Education
See All in Education
良い塩梅を実現する、AWSネットワーク3分クッキング
masakiokuda
1
230
Gitの仕組みと用語 / 01-b-term
kaityo256
PRO
0
310
From Participation to Outcomes
territorium
PRO
0
440
Fulbright DAI 2025 學人經驗分享
joannie
0
740
Tips for the Presentation - Lecture 2 - Advanced Topics in Big Data (4023256FNR)
signer
PRO
0
540
理工学系 第1回大学院説明会2026|東京科学大学(Science Tokyo)
sciencetokyo
PRO
1
1.4k
P3NFEST 2026 Spring ハンズオン「ハッキング・ラブ!はじめてのハッキングをやってみよう」資料
nomizone
0
420
Tangible, Embedded and Embodied Interaction - Lecture 7 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
2.1k
2026年度春学期 統計学 第2回 統計資料の収集と読み方 (2026. 4. 16)
akiraasano
PRO
0
130
小さなまちで始める デジタル創作の居場所〜すべての子どもが創造的に未来を描ける社会へ〜
codeforeveryone
0
410
リモートリポジトリの操作 / 02-c-remote
kaityo256
PRO
0
150
共感から、つくる: 変わり続ける自分と、誰かのための創造
micknerd
1
310
Featured
See All Featured
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
440
How to Think Like a Performance Engineer
csswizardry
28
2.5k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
370
The SEO Collaboration Effect
kristinabergwall1
0
420
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
520
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
370
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
130
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.6k
How to train your dragon (web standard)
notwaldorf
97
6.6k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.5k
Transcript
確率分布の紹介 2020/11/06
統計学の基本的な考え方 • データは真の分布から生成されているとする(大前提) • データや知識から真の分布を推測していく • 真の分布は, きっとこのような分布であろうと人間が想定して作成し, 推論に使うのが, 統計モデル(確率モデル)
• モデルの組み方のセッティングの違いが頻度論とベイズで異なる • どちらにしても, 統計モデルは確率論の言葉で表現される ⇒ 確率分布に親しむことが統計学の理解の第一歩 ⇒ コイン投げから, 色々な確率分布との関連性を確認していく
図解 : 統計学の基本的な考え方 統計モデル 頻度論, ベイズ 推論 解釈, 予測 真の分布
データ生成 評価 AIC, BIC, WAIC, WBIC, MSE
ベルヌーイ分布 : () ◼モデリングの対象事例 • コイン投げで表が出るか裏が出るか • ある患者が, 死亡・発症などイベントを起こすか否か ◼確率関数
= = ∗ 1 − 1− = 0,1
二項分布 : (, ) ◼モデリングの対象事例 • 枚のコインを投げて, 表が出た枚数は何枚か • 人の患者のうち,
死亡などイベントを起こしたのは何人か ◼確率関数 = = ∗ ∗ 1 − − = 0,1,2, … ,
ベータ分布 : (, ) ◼モデリングの対象事例 • ベルヌーイ分布や二項分布のpのモデリング • 一様乱数(0,1)を +
個生成して, 小さい順に並べたときの前から 番目, 後ろから + 1番目の数が従う分布 ◼確率密度関数 = 1 (, ) −1 ∗ 1 − −1 0 < < 1 ◼ちなみに • 二項分布とベータ分布の関係は多項分布とディリクレ分布の関係と同様
ポアソン分布 : () ◼モデリングの対象事例 • プロイセン陸軍で馬に蹴られて死亡した兵士数 • 一日に緊急入院した患者の人数 ◼確率関数 =
= − ! = 0,1,2, … ◼ちなみに • を増やして、確率を各試行に対してでなくて、微小な時間に対し て与えるイメージ(⇒ ハザード) • 総頻度で条件付けした、独立なポアソン分布の同時分布は多項分布
◼モデリングの対象事例 • 平均1/分に一本やってくる列車が到着するまでの時間 • 病院の受付の待ち時間 ◼確率密度関数 = ∗ − 0
< < ∞ ◼ちなみに • 指数分布とポアソン分布は表と裏の関係 • ある期間に平均回起こるイベントに対して, 何回発生したかが ポアソン分布, 起こるまでにどのくらいかかったが指数分布 指数分布 : ()
ガンマ分布 : (, ) ◼モデリングの対象事例 • 平均1/分に一本やってくる列車が本到着するまでの時間 • 保険金の支払額 ◼確率密度関数
= Γ() ∗ −1− 0 < < ∞ ◼ちなみに • 独立な指数分布に従う確率変数の和の分布はガンマ分布 • この関係は幾何分布と負の二項分布の関係と同様 • カイ二乗分布はガンマ分布の一種
◼モデリングの対象事例 • 部品や人の寿命や故障までの時間 • がん薬物療法の全生存期間(OS)や無増悪生存期間(PFS) ◼確率密度関数 = ∗ ∗ −1
∗ − 0 < < ∞ ◼ちなみに • 指数分布はハザードが一定(どの時間でもイベントが起きる確率 は不変であったが, ワイブル分布はハザードが時間によって変化 • = 1とすれば指数分布になる ワイブル分布 : (, )
関係性のまとめ ベルヌーイ分布 多項分布 ディリクレ分布 ベータ分布 一様分布 ポアソン分布 指数分布 ガンマ分布 ワイブル分布
カイ二乗分布 正規分布 二項分布 複数化 複数化 複数化 ハザード拡張 特殊化 回数と時間 極限 極限 確率の分布 確率の分布 順序の分布 マハラノビクス距離 条件付き同時分布
おまけ • ガウス積分 : −∞ ∞ − − 2
= • ガンマ関数 : Γ = 0 ∞ −1− • ベータ関数 : , = 0 1 −1 1 − −1 = Γ Γ() Γ(+) • スターリングの公式 : ! ≈ 2 • 上の四つの数式が読めると数理統計の見通しがよくなる • 確率分布を特徴づけるパラメータを母数とも呼ぶが, サンプルの数を母数と呼ぶのは誤 用(おそらく, 分母という言葉に引き摺られている)なので, 使わないようにしましょう • サンプルサイズとサンプル数という言葉もややこしいので, 気を付けましょう
参考になるオンライン資料 • 数学カフェ 確率・統計・機械学習回 「速習 確率・統計」 https://www.slideshare.net/matsukenbook/rev012 • 色々な確率分布とその応用 https://www.slideshare.net/hirokiiida165/ss-78477986
• 渡辺澄夫先生のデータ解析の講義資料 http://watanabe-www.math.dis.titech.ac.jp/users/swatanab/da2019.html
おしまい