Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
確率分布の紹介
Search
funain
November 06, 2020
Education
0
820
確率分布の紹介
確率分布に慣れ親しめるように, コイン投げのベルヌーイ分布からスタートして色々な確率分布との関連性を解説しています.
funain
November 06, 2020
Tweet
Share
More Decks by funain
See All by funain
第3回 クイズ大会 問題
funain
0
91
第3回 クイズ大会 解答
funain
0
91
第2回 クイズ大会 問題
funain
0
150
第2回 クイズ大会 解答
funain
0
130
2023年度にやりたいこと(めぐろLT会 #2)
funain
0
530
スクリーニング評価の注意点
funain
0
750
第1回 クイズ大会 問題
funain
0
1.3k
第1回 クイズ大会 解答
funain
0
260
フェアな比較を崩すもの ~交絡と効果修飾~ / Confounding EffectModification
funain
1
550
Other Decks in Education
See All in Education
建築学系 大学院説明会 2025|東京科学大学(Science Tokyo)
sciencetokyo
PRO
0
1.6k
Data Presentation - Lecture 5 - Information Visualisation (4019538FNR)
signer
PRO
0
2.4k
今も熱いもの!魂を揺さぶる戦士の儀式:マオリ族のハカ
shubox
0
190
系統性を意識したプログラミング教育~ガチャを実装しよう~
asial_edu
0
390
Course Review - Lecture 12 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.7k
Interaction - Lecture 10 - Information Visualisation (4019538FNR)
signer
PRO
0
2k
View Manipulation and Reduction - Lecture 9 - Information Visualisation (4019538FNR)
signer
PRO
1
2k
AIC 103 - Applications of Property Valuation: Essential Slides
rmccaic
0
130
子どものためのプログラミング道場『CoderDojo』〜法人提携例〜 / Partnership with CoderDojo Japan
coderdojojapan
4
16k
Are puppies a ranking factor?
jonoalderson
0
620
Data Processing and Visualisation Frameworks - Lecture 6 - Information Visualisation (4019538FNR)
signer
PRO
1
2.4k
2025年度春学期 統計学 第1回 イントロダクション (2025. 4. 10)
akiraasano
PRO
0
150
Featured
See All Featured
Code Review Best Practice
trishagee
68
18k
RailsConf 2023
tenderlove
30
1.1k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
6
660
Navigating Team Friction
lara
186
15k
Building a Modern Day E-commerce SEO Strategy
aleyda
40
7.3k
Build The Right Thing And Hit Your Dates
maggiecrowley
35
2.7k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Adopting Sorbet at Scale
ufuk
76
9.4k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
106
19k
Designing Experiences People Love
moore
142
24k
Faster Mobile Websites
deanohume
307
31k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Transcript
確率分布の紹介 2020/11/06
統計学の基本的な考え方 • データは真の分布から生成されているとする(大前提) • データや知識から真の分布を推測していく • 真の分布は, きっとこのような分布であろうと人間が想定して作成し, 推論に使うのが, 統計モデル(確率モデル)
• モデルの組み方のセッティングの違いが頻度論とベイズで異なる • どちらにしても, 統計モデルは確率論の言葉で表現される ⇒ 確率分布に親しむことが統計学の理解の第一歩 ⇒ コイン投げから, 色々な確率分布との関連性を確認していく
図解 : 統計学の基本的な考え方 統計モデル 頻度論, ベイズ 推論 解釈, 予測 真の分布
データ生成 評価 AIC, BIC, WAIC, WBIC, MSE
ベルヌーイ分布 : () ◼モデリングの対象事例 • コイン投げで表が出るか裏が出るか • ある患者が, 死亡・発症などイベントを起こすか否か ◼確率関数
= = ∗ 1 − 1− = 0,1
二項分布 : (, ) ◼モデリングの対象事例 • 枚のコインを投げて, 表が出た枚数は何枚か • 人の患者のうち,
死亡などイベントを起こしたのは何人か ◼確率関数 = = ∗ ∗ 1 − − = 0,1,2, … ,
ベータ分布 : (, ) ◼モデリングの対象事例 • ベルヌーイ分布や二項分布のpのモデリング • 一様乱数(0,1)を +
個生成して, 小さい順に並べたときの前から 番目, 後ろから + 1番目の数が従う分布 ◼確率密度関数 = 1 (, ) −1 ∗ 1 − −1 0 < < 1 ◼ちなみに • 二項分布とベータ分布の関係は多項分布とディリクレ分布の関係と同様
ポアソン分布 : () ◼モデリングの対象事例 • プロイセン陸軍で馬に蹴られて死亡した兵士数 • 一日に緊急入院した患者の人数 ◼確率関数 =
= − ! = 0,1,2, … ◼ちなみに • を増やして、確率を各試行に対してでなくて、微小な時間に対し て与えるイメージ(⇒ ハザード) • 総頻度で条件付けした、独立なポアソン分布の同時分布は多項分布
◼モデリングの対象事例 • 平均1/分に一本やってくる列車が到着するまでの時間 • 病院の受付の待ち時間 ◼確率密度関数 = ∗ − 0
< < ∞ ◼ちなみに • 指数分布とポアソン分布は表と裏の関係 • ある期間に平均回起こるイベントに対して, 何回発生したかが ポアソン分布, 起こるまでにどのくらいかかったが指数分布 指数分布 : ()
ガンマ分布 : (, ) ◼モデリングの対象事例 • 平均1/分に一本やってくる列車が本到着するまでの時間 • 保険金の支払額 ◼確率密度関数
= Γ() ∗ −1− 0 < < ∞ ◼ちなみに • 独立な指数分布に従う確率変数の和の分布はガンマ分布 • この関係は幾何分布と負の二項分布の関係と同様 • カイ二乗分布はガンマ分布の一種
◼モデリングの対象事例 • 部品や人の寿命や故障までの時間 • がん薬物療法の全生存期間(OS)や無増悪生存期間(PFS) ◼確率密度関数 = ∗ ∗ −1
∗ − 0 < < ∞ ◼ちなみに • 指数分布はハザードが一定(どの時間でもイベントが起きる確率 は不変であったが, ワイブル分布はハザードが時間によって変化 • = 1とすれば指数分布になる ワイブル分布 : (, )
関係性のまとめ ベルヌーイ分布 多項分布 ディリクレ分布 ベータ分布 一様分布 ポアソン分布 指数分布 ガンマ分布 ワイブル分布
カイ二乗分布 正規分布 二項分布 複数化 複数化 複数化 ハザード拡張 特殊化 回数と時間 極限 極限 確率の分布 確率の分布 順序の分布 マハラノビクス距離 条件付き同時分布
おまけ • ガウス積分 : −∞ ∞ − − 2
= • ガンマ関数 : Γ = 0 ∞ −1− • ベータ関数 : , = 0 1 −1 1 − −1 = Γ Γ() Γ(+) • スターリングの公式 : ! ≈ 2 • 上の四つの数式が読めると数理統計の見通しがよくなる • 確率分布を特徴づけるパラメータを母数とも呼ぶが, サンプルの数を母数と呼ぶのは誤 用(おそらく, 分母という言葉に引き摺られている)なので, 使わないようにしましょう • サンプルサイズとサンプル数という言葉もややこしいので, 気を付けましょう
参考になるオンライン資料 • 数学カフェ 確率・統計・機械学習回 「速習 確率・統計」 https://www.slideshare.net/matsukenbook/rev012 • 色々な確率分布とその応用 https://www.slideshare.net/hirokiiida165/ss-78477986
• 渡辺澄夫先生のデータ解析の講義資料 http://watanabe-www.math.dis.titech.ac.jp/users/swatanab/da2019.html
おしまい