Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
確率分布の紹介
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
funain
November 06, 2020
Education
1k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
確率分布の紹介
確率分布に慣れ親しめるように, コイン投げのベルヌーイ分布からスタートして色々な確率分布との関連性を解説しています.
funain
November 06, 2020
More Decks by funain
See All by funain
第3回 クイズ大会 問題
funain
0
140
第3回 クイズ大会 解答
funain
0
140
第2回 クイズ大会 問題
funain
0
210
第2回 クイズ大会 解答
funain
0
170
2023年度にやりたいこと(めぐろLT会 #2)
funain
0
610
スクリーニング評価の注意点
funain
0
910
第1回 クイズ大会 問題
funain
0
2.5k
第1回 クイズ大会 解答
funain
0
330
フェアな比較を崩すもの ~交絡と効果修飾~ / Confounding EffectModification
funain
1
640
Other Decks in Education
See All in Education
Curso de Consagração ao Sagrado Coração de Jesus - O Sagrado Coração na História (Aula 01)
cm_manaus
0
220
「機械学習と因果推論」入門 ③ 漸近効率な推定量と二重機械学習
masakat0
0
690
現場最前線から教えるデータサイエンス1 -ITベンダーにおけるデータサイエンティスト-
hidetoshikawaguchi
0
110
!コスパよくインターンに受かる方法!
ruribou
1
270
Modern Data Fetching Techniques in Angular
debug_mode
0
210
AI進化史:LLMからAIエージェントへ
mickey_kubo
0
200
면접관 눈에 띄는 데이터 분석 포트폴리오 만드는 법 | 2026년 5월 세미나
datarian
0
730
2026年度春学期 統計学 第7回 データの関係を知る(2)ー 回帰と決定係数 (2026. 5. 21)
akiraasano
PRO
0
140
Lectura 1 (PIT : Python Basico)
robintux
0
360
生成AI時代の情報発信
molmolken
0
130
Visionary Initiative: Future Intelligence 「未来の知性と社会の礎を築く」|Science Tokyo(東京科学大学)
sciencetokyo
PRO
0
400
[2026前期火5] 論理学(京都大学文学部 前期 第4回)「 ならば(→)の導入と証明ネット」
yatabe
0
450
Featured
See All Featured
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
BBQ
matthewcrist
89
10k
Context Engineering - Making Every Token Count
addyosmani
9
970
Skip the Path - Find Your Career Trail
mkilby
1
150
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.8k
Navigating Weather and Climate Data
rabernat
0
220
Claude Code のすすめ
schroneko
67
230k
Color Theory Basics | Prateek | Gurzu
gurzu
0
360
Testing 201, or: Great Expectations
jmmastey
46
8.2k
New Earth Scene 8
popppiees
3
2.3k
sira's awesome portfolio website redesign presentation
elsirapls
0
280
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
Transcript
確率分布の紹介 2020/11/06
統計学の基本的な考え方 • データは真の分布から生成されているとする(大前提) • データや知識から真の分布を推測していく • 真の分布は, きっとこのような分布であろうと人間が想定して作成し, 推論に使うのが, 統計モデル(確率モデル)
• モデルの組み方のセッティングの違いが頻度論とベイズで異なる • どちらにしても, 統計モデルは確率論の言葉で表現される ⇒ 確率分布に親しむことが統計学の理解の第一歩 ⇒ コイン投げから, 色々な確率分布との関連性を確認していく
図解 : 統計学の基本的な考え方 統計モデル 頻度論, ベイズ 推論 解釈, 予測 真の分布
データ生成 評価 AIC, BIC, WAIC, WBIC, MSE
ベルヌーイ分布 : () ◼モデリングの対象事例 • コイン投げで表が出るか裏が出るか • ある患者が, 死亡・発症などイベントを起こすか否か ◼確率関数
= = ∗ 1 − 1− = 0,1
二項分布 : (, ) ◼モデリングの対象事例 • 枚のコインを投げて, 表が出た枚数は何枚か • 人の患者のうち,
死亡などイベントを起こしたのは何人か ◼確率関数 = = ∗ ∗ 1 − − = 0,1,2, … ,
ベータ分布 : (, ) ◼モデリングの対象事例 • ベルヌーイ分布や二項分布のpのモデリング • 一様乱数(0,1)を +
個生成して, 小さい順に並べたときの前から 番目, 後ろから + 1番目の数が従う分布 ◼確率密度関数 = 1 (, ) −1 ∗ 1 − −1 0 < < 1 ◼ちなみに • 二項分布とベータ分布の関係は多項分布とディリクレ分布の関係と同様
ポアソン分布 : () ◼モデリングの対象事例 • プロイセン陸軍で馬に蹴られて死亡した兵士数 • 一日に緊急入院した患者の人数 ◼確率関数 =
= − ! = 0,1,2, … ◼ちなみに • を増やして、確率を各試行に対してでなくて、微小な時間に対し て与えるイメージ(⇒ ハザード) • 総頻度で条件付けした、独立なポアソン分布の同時分布は多項分布
◼モデリングの対象事例 • 平均1/分に一本やってくる列車が到着するまでの時間 • 病院の受付の待ち時間 ◼確率密度関数 = ∗ − 0
< < ∞ ◼ちなみに • 指数分布とポアソン分布は表と裏の関係 • ある期間に平均回起こるイベントに対して, 何回発生したかが ポアソン分布, 起こるまでにどのくらいかかったが指数分布 指数分布 : ()
ガンマ分布 : (, ) ◼モデリングの対象事例 • 平均1/分に一本やってくる列車が本到着するまでの時間 • 保険金の支払額 ◼確率密度関数
= Γ() ∗ −1− 0 < < ∞ ◼ちなみに • 独立な指数分布に従う確率変数の和の分布はガンマ分布 • この関係は幾何分布と負の二項分布の関係と同様 • カイ二乗分布はガンマ分布の一種
◼モデリングの対象事例 • 部品や人の寿命や故障までの時間 • がん薬物療法の全生存期間(OS)や無増悪生存期間(PFS) ◼確率密度関数 = ∗ ∗ −1
∗ − 0 < < ∞ ◼ちなみに • 指数分布はハザードが一定(どの時間でもイベントが起きる確率 は不変であったが, ワイブル分布はハザードが時間によって変化 • = 1とすれば指数分布になる ワイブル分布 : (, )
関係性のまとめ ベルヌーイ分布 多項分布 ディリクレ分布 ベータ分布 一様分布 ポアソン分布 指数分布 ガンマ分布 ワイブル分布
カイ二乗分布 正規分布 二項分布 複数化 複数化 複数化 ハザード拡張 特殊化 回数と時間 極限 極限 確率の分布 確率の分布 順序の分布 マハラノビクス距離 条件付き同時分布
おまけ • ガウス積分 : −∞ ∞ − − 2
= • ガンマ関数 : Γ = 0 ∞ −1− • ベータ関数 : , = 0 1 −1 1 − −1 = Γ Γ() Γ(+) • スターリングの公式 : ! ≈ 2 • 上の四つの数式が読めると数理統計の見通しがよくなる • 確率分布を特徴づけるパラメータを母数とも呼ぶが, サンプルの数を母数と呼ぶのは誤 用(おそらく, 分母という言葉に引き摺られている)なので, 使わないようにしましょう • サンプルサイズとサンプル数という言葉もややこしいので, 気を付けましょう
参考になるオンライン資料 • 数学カフェ 確率・統計・機械学習回 「速習 確率・統計」 https://www.slideshare.net/matsukenbook/rev012 • 色々な確率分布とその応用 https://www.slideshare.net/hirokiiida165/ss-78477986
• 渡辺澄夫先生のデータ解析の講義資料 http://watanabe-www.math.dis.titech.ac.jp/users/swatanab/da2019.html
おしまい