Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計学入門講座 第5回スライド
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
TechmathProject
August 11, 2025
Science
94
0
Share
統計学入門講座 第5回スライド
てくますプロジェクトで行った統計学入門講座の第5回スライドです。
実施:2024/12/16
TechmathProject
August 11, 2025
More Decks by TechmathProject
See All by TechmathProject
統計学入門講座 第6回スライド
techmathproject
0
82
統計学入門講座 第7回スライド
techmathproject
0
89
統計学入門講座 第8回スライド
techmathproject
0
90
統計学入門講座 第4回スライド
techmathproject
0
340
統計学入門講座 第3回スライド
techmathproject
0
230
統計学入門講座 第2回スライド
techmathproject
0
340
統計学入門講座 第1回スライド
techmathproject
0
730
線形代数学入門講座 第1回スライド
techmathproject
0
290
線形代数学入門講座 第2回スライド
techmathproject
0
160
Other Decks in Science
See All in Science
会社でMLモデルを作るとは @電気通信大学 データアントレプレナーフェロープログラム
yuto16
1
680
機械学習 - 決定木からはじめる機械学習
trycycle
PRO
0
1.4k
【論文紹介】Is CLIP ideal? No. Can we fix it?Yes! 第65回 コンピュータビジョン勉強会@関東
shun6211
5
2.5k
AIを用いた PID制御で部屋 の温度制御をしてみた
nearme_tech
PRO
0
110
MATSUO Makiko
genomethica
0
140
データベース03: 関係データモデル
trycycle
PRO
1
510
Deep Space Network (abreviated)
tonyrice
0
150
水耕栽培を始める前に知っておきたい植物の科学
grow_design_lab
0
180
防災デジタル分野での官民共創の取り組み (1)防災DX官民共創をどう進めるか
ditccsugii
0
650
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
PRO
1
280
データベース05: SQL(2/3) 結合質問
trycycle
PRO
0
1.1k
機械学習 - pandas入門
trycycle
PRO
0
580
Featured
See All Featured
Writing Fast Ruby
sferik
630
63k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
150
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
360
Producing Creativity
orderedlist
PRO
348
40k
The Cost Of JavaScript in 2023
addyosmani
55
9.9k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
Done Done
chrislema
186
16k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
320
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Prompt Engineering for Job Search
mfonobong
0
310
Transcript
統計学入門講座 第5回 検定の枠組み てくますプロジェクト
てくますプロジェクトについて • てくますプロジェクトは, 「考える楽しさを探そう!」が合言葉の, 数学と情報科学の学習コミュニティです. • 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために,
私たちは活動しています. • 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. • X などで宣伝いただけると大変嬉しいです. (#てくますプロジェクト) • 講師はゆっきん(桑原)が担当します. ◦ 数学教師→システムエンジニア→プログラミング講師 ◦ 数学, プログラミング, ボードゲームが好きです. ◦ てくますプロジェクトやボードゲームコミュニティの運営を 行っています.
本講座について • 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定2級を目指す方にも適した内容です. • 本講座は各回, 前半で知識のインプット,
後半で問題演習を行います. • 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください! • 本講座作成にあたり, 特に参考にした本を 右に挙げておきます. 2冊ともオススメです. • 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.
スケジュール 第1回 データの整理 2024/10/07 第4回 確率分布 2024/12/02 第3回 確率の基本 2024/11/18
第2回 データの散らばり 2024/10/28 第5回 検定の枠組み 2024/12/16 第8回 2標本t検定 2025/02/10 第6回 母平均の検定 2025/01/06 第7回 母分散, 母比率の検定 2025/01/27 本講座は全8回です. 各回の内容は以下の通りです.
目次 1. 標準正規分布を使った予測 標準正規分布表を使って, 正規分布に関する確率を求められるようになりましょう. 2. 仮説検定をしよう 標準正規分布を使った予測を仮説検定に逆用する方法を学びます.
標準正規分布を使った予測
正規分布の復習 正規分布は最もよく知られた確率分布で, 人間の身長や試験の点数など, さまざまな場面で登場します. 特に, 平均値が 0, 標準偏差が 1 の正規分布を標準正規分布と呼びました.
標準正規分布から観測したデータについて -1 〜 1 の範囲にある確率:約68% -2 〜 2 の範囲にある確率:約95% 標準正規分布
標準正規分布表を使おう 標準正規分布表を用いれば, 標準正規分布に関する 他の範囲の確率を求めることができます. 例1 観測したデータが 1.65 以上の確率 表の縦軸が1.6, 横軸が0.05のところを確認し,
0.0495(=4.95%) 例2 観測したデータが -1 以下の確率 グラフの左右対称性より 1 以上の確率と同じなので, 0.1587(=15.87%) 例3 観測したデータが -1 以上の確率 1 - 0.1587 = 0.8413(=84.13%)
正規分布を標準正規分布に変換(標準化) データ x が平均値が μ, 標準偏差が σ の正規分布のデータであるとき, という加工をすると, データ
z は標準正規分布のデータになります. 平均値が μ, 標準偏差が σ の正規分布 ⬇ 全データから μ を引 く 平均値が 0, 標準偏差が σ の正規分布 ⬇ 全データを σ で割る 平均値が 0, 標準偏差が 1 の正規分布 上の式はデータが平均値から標準偏差何個分 離れているかを調べる式でもあります.
具体例1 あるテストの点数が平均値 60 点, 標準偏差 12 点の正規分布に従っているとします. • 観測したデータが 80
点以上の確率は? 標準正規分布で観測したデータが 1.67 以上の確率は 0.0475(=4.75%) • 観測したデータが上位 1 % であるためには何点以上取らなければならない? 88 点以上で上位 1 %になる.
具体例2 (表裏の出る確率が等しい)コインを 400 回投げたとします. 表が出た回数は, 二項分布に従います.(第4回を参照) • 平均値:400×0.5=200 • 分散:400×0.5×0.5=100
• 標準偏差:10 試行回数が十分多いとき, 近似的に正規分布であると考えられます.(中心極限定理) 表が出た回数が 220 回以上の確率は? 標準正規分布で観測したデータが 2 以上の確率は 0.0228(=2.28%)
仮説検定をしよう
母集団の推定 推測統計は得られた一部のデータをもとに, 背後に広がる全データの特徴を推測する学問です. 得られた一部のデータのことを標本と呼び, 背後に広がる全データを母集団と呼びます. 母集団 標本 抽出 推測 知りたい
• 母平均 • 母分散 • 母標準偏差 • 母比率 計算できる • 標本平均 • 標本分散 • 標本標準偏差 • 標本比率 母集団を特徴づけるこれらの値を 母数と呼びます
仮説検定をしよう (表裏の出る確率が等しい)N 枚のコインを一斉に投げたところ, 表が 50 枚出ました. 問:Nとして 80 を考えることは妥当でしょうか? N
= 80 を帰無仮説, N ≠ 80 を対立仮説とします. 帰無仮説から帰無分布を作成し, 今回の事象がどの程度起こりうるものなのかを調べます. • 平均値:80×0.5=40 • 分散:80×0.5×0.5=20 • 標準偏差:2√5 表が出た枚数 50 を標準化します.
仮説検定をしよう 帰無分布に棄却域と呼ばれる領域を作ります. 棄却域は次のように作成します. 1. 帰無分布の端っこに作成する 2. 棄却域の合計が5%(左右2.5%ずつ)に なるように作成する この5%のことを有意水準と呼びます. 有意水準には5%の他に,
1%などを用いることもあります. なお, 標準正規分布において, 左右2.5%の棄却域の境目は ±1.96 です. (標準正規分布表を参照) 棄却域 棄却域
仮説検定をしよう 2.237… は 1.96 より大きいので棄却域に入っています. このとき, 次のように判断します. 今回のこの一連の作業のことを(仮説)検定と呼びます. 今回得られた「80枚中50枚表」という結果は帰無仮説 から予想される値とかけ離れすぎている.
これは, 「N=80」という帰無仮説自体が間違っている ということではないか. そのため, 対立仮説の方を採用し, 「N=80と考えるのは妥当でない(有意水準5%)」と 結論づけます. 棄却域 棄却域
仮説検定をしよう (表裏の出る確率が等しい)N 枚のコインを一斉に投げたところ, 表が 50 枚出ました. 問:Nとして 120 を考えることは妥当でしょうか? N
= 120 を帰無仮説, N ≠ 120 を対立仮説とします. 帰無仮説から帰無分布を作成します. • 平均値:120×0.5=60 • 分散:120×0.5×0.5=30 • 標準偏差:√30 -1.825 は -1.96 より大きいので, 棄却域に入っていません. そのため N=120 を棄却する証拠は得られませんでした. ※ N=120が妥当であるという結論が得られたわけではないことに注意しましょう.
まとめ • 標準正規分布表を用いることで, 正規分布に関する確率を求めることができ, これによって予測を行え ます. • データ x が平均値が
μ, 標準偏差が σ の正規分布のデータであるとき, 次の加工で得られたデータ z は標準正規分布のデータになります.(標準化) • 推測統計は標本のデータをもとに, 母集団の特徴を推測する学問です. • 標準正規分布を使った予測を逆用することで, 仮説検定を行うことができます. ◦ 標本(観測データ)を標準化し, 棄却域に入るかどうかチェックしましょう. ◦ 「棄却域に入り, 帰無仮説を棄却できた → 対立仮説が妥当だと結論づける」はOK! ◦ 「棄却域に入らず, 帰無仮説を棄却できなかった → 帰無仮説が妥当だと結論づける」はNG!
演習問題を解こう!