Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計学入門講座 第6回スライド
Search
TechmathProject
August 11, 2025
Science
0
55
統計学入門講座 第6回スライド
てくますプロジェクトで行った統計学入門講座の第6回スライドです。
実施:2025/01/06
TechmathProject
August 11, 2025
Tweet
Share
More Decks by TechmathProject
See All by TechmathProject
統計学入門講座 第5回スライド
techmathproject
0
69
統計学入門講座 第7回スライド
techmathproject
0
53
統計学入門講座 第8回スライド
techmathproject
0
61
統計学入門講座 第4回スライド
techmathproject
0
310
統計学入門講座 第3回スライド
techmathproject
0
200
統計学入門講座 第2回スライド
techmathproject
0
300
統計学入門講座 第1回スライド
techmathproject
0
650
線形代数学入門講座 第1回スライド
techmathproject
0
230
線形代数学入門講座 第2回スライド
techmathproject
0
130
Other Decks in Science
See All in Science
(メタ)科学コミュニケーターからみたAI for Scienceの同床異夢
rmaruy
0
190
Text-to-SQLの既存の評価指標を問い直す
gotalab555
1
190
DMMにおけるABテスト検証設計の工夫
xc6da
1
1.6k
[Paper Introduction] From Bytes to Ideas:Language Modeling with Autoregressive U-Nets
haruumiomoto
0
220
データベース11: 正規化(1/2) - 望ましくない関係スキーマ
trycycle
PRO
0
1.1k
Testing the Longevity Bottleneck Hypothesis
chinson03
0
200
動的トリートメント・レジームを推定するDynTxRegimeパッケージ
saltcooky12
0
270
HajimetenoLT vol.17
hashimoto_kei
1
200
YouTubeにおける撤回論文の参照実態 / metascience-meetup2026
corgies
1
200
Kaggle: NeurIPS - Open Polymer Prediction 2025 コンペ 反省会
calpis10000
0
430
データマイニング - コミュニティ発見
trycycle
PRO
0
220
baseballrによるMLBデータの抽出と階層ベイズモデルによる打率の推定 / TokyoR118
dropout009
2
870
Featured
See All Featured
The Language of Interfaces
destraynor
162
26k
How GitHub (no longer) Works
holman
316
150k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.5k
Designing Experiences People Love
moore
143
24k
Exploring anti-patterns in Rails
aemeredith
2
290
My Coaching Mixtape
mlcsv
0
80
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
160
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
200
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Transcript
統計学入門講座 第6回 母平均の検定 てくますプロジェクト
てくますプロジェクトについて • てくますプロジェクトは, 「考える楽しさを探そう!」が合言葉の, 数学と情報科学の学習コミュニティです. • 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために,
私たちは活動しています. • 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. • X などで宣伝いただけると大変嬉しいです. (#てくますプロジェクト) • 講師はゆっきん(桑原)が担当します. ◦ 数学教師→システムエンジニア→プログラミング講師 ◦ 数学, プログラミング, ボードゲームが好きです. ◦ てくますプロジェクトやボードゲームコミュニティの運営を 行っています.
本講座について • 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定2級を目指す方にも適した内容です. • 本講座は各回, 前半で知識のインプット,
後半で問題演習を行います. • 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください! • 本講座作成にあたり, 特に参考にした本を 右に挙げておきます. 2冊ともオススメです. • 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.
スケジュール 第1回 データの整理 2024/10/07 第4回 確率分布 2024/12/02 第3回 確率の基本 2024/11/18
第2回 データの散らばり 2024/10/28 第5回 検定の枠組み 2024/12/16 第8回 2標本t検定 2025/02/10 第6回 母平均の検定 2025/01/06 第7回 母分散, 母比率の検定 2025/01/27 本講座は全8回です. 各回の内容は以下の通りです.
目次 1. 母集団と標本 母平均の検定に入る前に, 母集団と標本に関するいくつかのトピックを紹介します. 2. 母平均の検定(母分散既知ver) 母分散が分かっている状態で母平均を検定する方法を学びます. 3. 母平均の検定(母分散未知ver)
母分散が分かっていない状態で母平均を検定する方法を学びます.
母集団と標本
区間推定と信頼区間 母集団 標本 抽出 推測 知りたい • 母平均 • 母分散
• 母標準偏差 • 母比率 計算できる • 標本平均 • 標本分散 • 標本標準偏差 • 標本比率 母平均や母分散などの母数を区間で推測することを区間推定といいます. また, 信頼区間とは, 区間推定の結果得られる「母数が含まれている可能性の高い範囲」のことをいい ます. 例えば, 母平均の95%信頼区間の場合, 「この計算方法を繰り返したとき, 95%の確率で母平均が信頼区 間に含まれる」ことを意味します. 今日のテーマ!
標本分散について 母分散と標本分散は計算方法が異なることに注意が必要です. 母分散:偏差(母平均からの差)の2乗の和をデータ数で割った値(つまり偏差の2乗の平均値) 標本分散:偏差(標本平均からの差)の2乗の和を データ数 - 1 で割った値 標本平均: 標本分散:
標本標準偏差: 偏差の自由度の数 =意味のある偏差の数 ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65
複数データの平均値は1個のデータより分散が小さくなる さいころ投げにおいて出る目の母平均は 3.5 です. さいころを投げる試行を1回行ったとき 出る目の期待値:3.5 出る目の分散: さいころを投げる試行を2回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散:
さいころを投げる試行をn回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散: n個のデータの平均値の分散は 1個のデータの分散の 倍
複数データの平均値は1個のデータより分散が小さくなる 分散が小さくなれば, 予測の範囲を狭めることができます. そのことを確かめましょう. ある母集団は母平均100, 母標準偏差20の正規分布に従います. この母集団からデータを抽出します. (1) 標本サイズ16の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか
(2) 標本サイズ64の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか. (1) 標本平均 の分布は, 平均値100, 標準偏差 20/√16=5 の 正規分布です. (2) 標本平均 の分布は, 平均値100, 標準偏差 20/√64=2.5 の 正規分布です. 予測の範囲が狭くなりました
母平均の検定(母分散既知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散既知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:母分散 をサンプルサイズで割った値なので, 12÷10=1.2 • 標準偏差:√1.2≒1.095 の正規分布となります. 観測で得られた標本平均は, このデータを標準化すると,
母平均の区間推定(母分散既知ver) 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62,
58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう.
65 は母平均 の95%信頼区間 に入っていません. これは, が -1.96以上1.96以下の範囲に入っていない(=棄却域に入る)ことを意味します. よって, 母平均 が65である仮説は棄却されます. 母平均の検定(母分散既知ver) ある生物学の実験で,
10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 が65であるか検定しましょう. 有意水準は 5%(両側検定)とします. ※本問において, 母平均が分からないのに母分散が分かっているというのは都合が良いように感じられ ます. 次は, 母分散も分かっていないケースを考えましょう.
母平均の検定(母分散未知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:??? • 標準偏差:??? の正規分布となります. ➡ 観測で得られた標本平均 60.4 の標準化を先ほどのように行うことができません. そこで今回, 母標準偏差 の代わりに標本標準偏差 を使用して標準化することを考えましょう.
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) ではなく で標準化します. これを Student化 と呼びます. Student化で得られたデータはもはや標準正規分布に従いません. その代わりに, 自由度 の t分布 に従うことが知られています.
母平均の区間推定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. が自由度 9 の t分布 に従います. 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は
母平均の検定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 が62であるか検定しましょう. 有意水準は 5%(両側検定)とします. 62 は母平均 の95%信頼区間 に入っています. これは, が -1.96以上1.96以下の範囲に入っている(=棄却域に入らない)ことを意味します. よって, 母平均 が62である仮説は棄却されません. ( が62であることが妥当であると判断したわけではないことに注意)
まとめ • 標本分散を計算する際は, n ではなく n-1 で割ることに注意しましょう. • 複数データの平均値は1個のデータより分散が小さくなります. そのため,
標本のサンプルサイズを大きくすることは重要です. • 母平均の区間推定 ◦ 母分散が既知の場合 が標準正規分布に従うことを利用しましょう ◦ 母分散が未知の場合 が自由度 n-1 の t分布 に従うことを利用しましょう.
演習問題を解こう!