統計学入門講座第5回スライド

統計学入門講座第5回　検定の枠組みてくますプロジェクト

てくますプロジェクトについて • てくますプロジェクトは, 「考える楽しさを探そう！」が合言葉の, 数学と情報科学の学習コミュニティです. • 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために,
私たちは活動しています. • 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. • X などで宣伝いただけると大変嬉しいです. （#てくますプロジェクト） • 講師はゆっきん（桑原）が担当します. ◦ 数学教師→システムエンジニア→プログラミング講師 ◦ 数学, プログラミング, ボードゲームが好きです. ◦ てくますプロジェクトやボードゲームコミュニティの運営を行っています.

本講座について • 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定２級を目指す方にも適した内容です. • 本講座は各回, 前半で知識のインプット,
後半で問題演習を行います. • 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください！ • 本講座作成にあたり, 特に参考にした本を右に挙げておきます. ２冊ともオススメです. • 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.

スケジュール第１回データの整理 2024/10/07 第４回確率分布 2024/12/02 第３回確率の基本 2024/11/18
第２回データの散らばり 2024/10/28 第５回検定の枠組み 2024/12/16 第８回 2標本t検定 2025/02/10 第６回母平均の検定 2025/01/06 第７回母分散, 母比率の検定 2025/01/27 本講座は全８回です. 各回の内容は以下の通りです.

目次 1. 標準正規分布を使った予測標準正規分布表を使って, 正規分布に関する確率を求められるようになりましょう. 2. 仮説検定をしよう標準正規分布を使った予測を仮説検定に逆用する方法を学びます.

標準正規分布を使った予測

正規分布の復習正規分布は最もよく知られた確率分布で, 人間の身長や試験の点数など, さまざまな場面で登場します. 特に, 平均値が 0, 標準偏差が 1 の正規分布を標準正規分布と呼びました.
標準正規分布から観測したデータについて -1 〜 1 の範囲にある確率：約68％ -2 〜 2 の範囲にある確率：約95％標準正規分布

標準正規分布表を使おう標準正規分布表を用いれば, 標準正規分布に関する他の範囲の確率を求めることができます. 例1　観測したデータが 1.65 以上の確率　　表の縦軸が1.6, 横軸が0.05のところを確認し,
　　 0.0495（=4.95％）例2　観測したデータが -1 以下の確率　　グラフの左右対称性より 1 以上の確率と同じなので, 　　 0.1587（=15.87％）例3　観測したデータが -1 以上の確率　　 1 - 0.1587 = 0.8413（=84.13％）

正規分布を標準正規分布に変換（標準化）データ x が平均値が μ, 標準偏差が σ の正規分布のデータであるとき, という加工をすると, データ
z は標準正規分布のデータになります. 平均値が μ, 標準偏差が σ の正規分布　　　　　　　⬇　全データから μ を引く平均値が 0, 標準偏差が σ の正規分布　　　　　　　⬇　全データを σ で割る平均値が 0, 標準偏差が 1 の正規分布上の式はデータが平均値から標準偏差何個分離れているかを調べる式でもあります.

具体例1 あるテストの点数が平均値 60 点, 標準偏差 12 点の正規分布に従っているとします. • 観測したデータが 80
点以上の確率は？標準正規分布で観測したデータが 1.67 以上の確率は 0.0475（=4.75％） • 観測したデータが上位 1 ％であるためには何点以上取らなければならない？ 88 点以上で上位 1 ％になる.

具体例2 （表裏の出る確率が等しい）コインを 400 回投げたとします. 表が出た回数は, 二項分布に従います.（第４回を参照） • 平均値：400×0.5=200 • 分散：400×0.5×0.5=100
• 標準偏差：10 試行回数が十分多いとき, 近似的に正規分布であると考えられます.（中心極限定理）表が出た回数が 220 回以上の確率は？標準正規分布で観測したデータが 2 以上の確率は 0.0228（=2.28％）

仮説検定をしよう

母集団の推定推測統計は得られた一部のデータをもとに, 背後に広がる全データの特徴を推測する学問です. 得られた一部のデータのことを標本と呼び, 背後に広がる全データを母集団と呼びます. 母集団標本抽出推測知りたい
• 母平均 • 母分散 • 母標準偏差 • 母比率計算できる • 標本平均 • 標本分散 • 標本標準偏差 • 標本比率母集団を特徴づけるこれらの値を母数と呼びます

仮説検定をしよう（表裏の出る確率が等しい）N 枚のコインを一斉に投げたところ, 表が 50 枚出ました. 問：Nとして 80 を考えることは妥当でしょうか？ N
= 80 を帰無仮説, N ≠ 80 を対立仮説とします. 帰無仮説から帰無分布を作成し, 今回の事象がどの程度起こりうるものなのかを調べます. • 平均値：80×0.5=40 • 分散：80×0.5×0.5=20 • 標準偏差：2√5　表が出た枚数 50 を標準化します.

仮説検定をしよう帰無分布に棄却域と呼ばれる領域を作ります. 棄却域は次のように作成します. 1. 帰無分布の端っこに作成する 2. 棄却域の合計が5%（左右2.5%ずつ）になるように作成するこの5%のことを有意水準と呼びます. 有意水準には5%の他に,
1%などを用いることもあります. なお, 標準正規分布において, 左右2.5％の棄却域の境目は ±1.96 です. （標準正規分布表を参照）棄却域棄却域

仮説検定をしよう 2.237… は 1.96 より大きいので棄却域に入っています. このとき, 次のように判断します. 今回のこの一連の作業のことを（仮説）検定と呼びます. 今回得られた「80枚中50枚表」という結果は帰無仮説から予想される値とかけ離れすぎている.
これは, 「N=80」という帰無仮説自体が間違っているということではないか. そのため, 対立仮説の方を採用し, 「N=80と考えるのは妥当でない（有意水準5%）」と結論づけます. 棄却域棄却域

仮説検定をしよう（表裏の出る確率が等しい）N 枚のコインを一斉に投げたところ, 表が 50 枚出ました. 問：Nとして 120 を考えることは妥当でしょうか？ N
= 120 を帰無仮説, N ≠ 120 を対立仮説とします. 帰無仮説から帰無分布を作成します. • 平均値：120×0.5=60 • 分散：120×0.5×0.5=30 • 標準偏差：√30　　 -1.825 は -1.96 より大きいので, 棄却域に入っていません. そのため N=120 を棄却する証拠は得られませんでした. ※ N=120が妥当であるという結論が得られたわけではないことに注意しましょう.

まとめ • 標準正規分布表を用いることで, 正規分布に関する確率を求めることができ, これによって予測を行えます. • データ x が平均値が
μ, 標準偏差が σ の正規分布のデータであるとき, 次の加工で得られたデータ z は標準正規分布のデータになります.（標準化） • 推測統計は標本のデータをもとに, 母集団の特徴を推測する学問です. • 標準正規分布を使った予測を逆用することで, 仮説検定を行うことができます. ◦ 標本（観測データ）を標準化し, 棄却域に入るかどうかチェックしましょう. ◦ 「棄却域に入り, 帰無仮説を棄却できた → 対立仮説が妥当だと結論づける」はOK！ ◦ 「棄却域に入らず, 帰無仮説を棄却できなかった → 帰無仮説が妥当だと結論づける」はNG！

演習問題を解こう！

統計学入門講座第5回スライド

統計学入門講座第5回スライド

TechmathProject

More Decks by TechmathProject

Other Decks in Science

Featured

Transcript

統計学入門講座第5回　検定の枠組みてくますプロジェクト

スケジュール第１回データの整理 2024/10/07 第４回確率分布 2024/12/02 第３回確率の基本 2024/11/18

目次 1. 標準正規分布を使った予測標準正規分布表を使って, 正規分布に関する確率を求められるようになりましょう. 2. 仮説検定をしよう標準正規分布を使った予測を仮説検定に逆用する方法を学びます.

標準正規分布を使った予測

正規分布の復習正規分布は最もよく知られた確率分布で, 人間の身長や試験の点数など, さまざまな場面で登場します. 特に, 平均値が 0, 標準偏差が 1 の正規分布を標準正規分布と呼びました.

標準正規分布表を使おう標準正規分布表を用いれば, 標準正規分布に関する他の範囲の確率を求めることができます. 例1　観測したデータが 1.65 以上の確率　　表の縦軸が1.6, 横軸が0.05のところを確認し,

正規分布を標準正規分布に変換（標準化）データ x が平均値が μ, 標準偏差が σ の正規分布のデータであるとき, という加工をすると, データ

具体例1 あるテストの点数が平均値 60 点, 標準偏差 12 点の正規分布に従っているとします. • 観測したデータが 80

具体例2 （表裏の出る確率が等しい）コインを 400 回投げたとします. 表が出た回数は, 二項分布に従います.（第４回を参照） • 平均値：400×0.5=200 • 分散：400×0.5×0.5=100

仮説検定をしよう

仮説検定をしよう（表裏の出る確率が等しい）N 枚のコインを一斉に投げたところ, 表が 50 枚出ました. 問：Nとして 80 を考えることは妥当でしょうか？ N

仮説検定をしよう（表裏の出る確率が等しい）N 枚のコインを一斉に投げたところ, 表が 50 枚出ました. 問：Nとして 120 を考えることは妥当でしょうか？ N

まとめ • 標準正規分布表を用いることで, 正規分布に関する確率を求めることができ, これによって予測を行えます. • データ x が平均値が

演習問題を解こう！

統計学入門講座 第5回スライド

統計学入門講座 第5回スライド

More Decks by TechmathProject

Other Decks in Science

Featured

Transcript

統計学入門講座第5回スライド

統計学入門講座第5回スライド