Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計学入門講座 第6回スライド
Search
TechmathProject
August 11, 2025
Science
0
7
統計学入門講座 第6回スライド
てくますプロジェクトで行った統計学入門講座の第6回スライドです。
実施:2025/01/06
TechmathProject
August 11, 2025
Tweet
Share
More Decks by TechmathProject
See All by TechmathProject
統計学入門講座 第5回スライド
techmathproject
0
10
統計学入門講座 第7回スライド
techmathproject
0
7
統計学入門講座 第8回スライド
techmathproject
0
6
統計学入門講座 第4回スライド
techmathproject
0
170
統計学入門講座 第3回スライド
techmathproject
0
120
統計学入門講座 第2回スライド
techmathproject
0
170
統計学入門講座 第1回スライド
techmathproject
0
420
線形代数学入門講座 第1回スライド
techmathproject
0
100
線形代数学入門講座 第2回スライド
techmathproject
0
72
Other Decks in Science
See All in Science
点群ライブラリPDALをGoogleColabにて実行する方法の紹介
kentaitakura
1
340
データベース06: SQL (3/3) 副問い合わせ
trycycle
PRO
1
620
機械学習 - 授業概要
trycycle
PRO
0
220
データベース08: 実体関連モデルとは?
trycycle
PRO
0
920
データベース03: 関係データモデル
trycycle
PRO
1
240
白金鉱業Meetup Vol.16_【初学者向け発表】 数理最適化のはじめの一歩 〜身近な問題で学ぶ最適化の面白さ〜
brainpadpr
11
2.3k
データベース11: 正規化(1/2) - 望ましくない関係スキーマ
trycycle
PRO
0
920
07_浮世満理子_アイディア高等学院学院長_一般社団法人全国心理業連合会代表理事_紹介資料.pdf
sip3ristex
0
560
LayerXにおける業務の完全自動運転化に向けたAI技術活用事例 / layerx-ai-jsai2025
shimacos
2
1.4k
データから見る勝敗の法則 / The principle of victory discovered by science (open lecture in NSSU)
konakalab
1
100
Trend Classification of InSAR Displacement Time Series Using SAE–CNN
satai
3
520
モンテカルロDCF法による事業価値の算出(モンテカルロ法とベイズモデリング) / Business Valuation Using Monte Carlo DCF Method (Monte Carlo Simulation and Bayesian Modeling)
ikuma_w
0
220
Featured
See All Featured
Become a Pro
speakerdeck
PRO
29
5.5k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3k
Rails Girls Zürich Keynote
gr2m
95
14k
4 Signs Your Business is Dying
shpigford
184
22k
How STYLIGHT went responsive
nonsquared
100
5.7k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
How to train your dragon (web standard)
notwaldorf
96
6.2k
A Modern Web Designer's Workflow
chriscoyier
695
190k
Designing Experiences People Love
moore
142
24k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.4k
The World Runs on Bad Software
bkeepers
PRO
70
11k
Building an army of robots
kneath
306
45k
Transcript
統計学入門講座 第6回 母平均の検定 てくますプロジェクト
てくますプロジェクトについて • てくますプロジェクトは, 「考える楽しさを探そう!」が合言葉の, 数学と情報科学の学習コミュニティです. • 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために,
私たちは活動しています. • 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. • X などで宣伝いただけると大変嬉しいです. (#てくますプロジェクト) • 講師はゆっきん(桑原)が担当します. ◦ 数学教師→システムエンジニア→プログラミング講師 ◦ 数学, プログラミング, ボードゲームが好きです. ◦ てくますプロジェクトやボードゲームコミュニティの運営を 行っています.
本講座について • 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定2級を目指す方にも適した内容です. • 本講座は各回, 前半で知識のインプット,
後半で問題演習を行います. • 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください! • 本講座作成にあたり, 特に参考にした本を 右に挙げておきます. 2冊ともオススメです. • 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.
スケジュール 第1回 データの整理 2024/10/07 第4回 確率分布 2024/12/02 第3回 確率の基本 2024/11/18
第2回 データの散らばり 2024/10/28 第5回 検定の枠組み 2024/12/16 第8回 2標本t検定 2025/02/10 第6回 母平均の検定 2025/01/06 第7回 母分散, 母比率の検定 2025/01/27 本講座は全8回です. 各回の内容は以下の通りです.
目次 1. 母集団と標本 母平均の検定に入る前に, 母集団と標本に関するいくつかのトピックを紹介します. 2. 母平均の検定(母分散既知ver) 母分散が分かっている状態で母平均を検定する方法を学びます. 3. 母平均の検定(母分散未知ver)
母分散が分かっていない状態で母平均を検定する方法を学びます.
母集団と標本
区間推定と信頼区間 母集団 標本 抽出 推測 知りたい • 母平均 • 母分散
• 母標準偏差 • 母比率 計算できる • 標本平均 • 標本分散 • 標本標準偏差 • 標本比率 母平均や母分散などの母数を区間で推測することを区間推定といいます. また, 信頼区間とは, 区間推定の結果得られる「母数が含まれている可能性の高い範囲」のことをいい ます. 例えば, 母平均の95%信頼区間の場合, 「この計算方法を繰り返したとき, 95%の確率で母平均が信頼区 間に含まれる」ことを意味します. 今日のテーマ!
標本分散について 母分散と標本分散は計算方法が異なることに注意が必要です. 母分散:偏差(母平均からの差)の2乗の和をデータ数で割った値(つまり偏差の2乗の平均値) 標本分散:偏差(標本平均からの差)の2乗の和を データ数 - 1 で割った値 標本平均: 標本分散:
標本標準偏差: 偏差の自由度の数 =意味のある偏差の数 ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65
複数データの平均値は1個のデータより分散が小さくなる さいころ投げにおいて出る目の母平均は 3.5 です. さいころを投げる試行を1回行ったとき 出る目の期待値:3.5 出る目の分散: さいころを投げる試行を2回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散:
さいころを投げる試行をn回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散: n個のデータの平均値の分散は 1個のデータの分散の 倍
複数データの平均値は1個のデータより分散が小さくなる 分散が小さくなれば, 予測の範囲を狭めることができます. そのことを確かめましょう. ある母集団は母平均100, 母標準偏差20の正規分布に従います. この母集団からデータを抽出します. (1) 標本サイズ16の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか
(2) 標本サイズ64の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか. (1) 標本平均 の分布は, 平均値100, 標準偏差 20/√16=5 の 正規分布です. (2) 標本平均 の分布は, 平均値100, 標準偏差 20/√64=2.5 の 正規分布です. 予測の範囲が狭くなりました
母平均の検定(母分散既知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散既知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:母分散 をサンプルサイズで割った値なので, 12÷10=1.2 • 標準偏差:√1.2≒1.095 の正規分布となります. 観測で得られた標本平均は, このデータを標準化すると,
母平均の区間推定(母分散既知ver) 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62,
58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう.
65 は母平均 の95%信頼区間 に入っていません. これは, が -1.96以上1.96以下の範囲に入っていない(=棄却域に入る)ことを意味します. よって, 母平均 が65である仮説は棄却されます. 母平均の検定(母分散既知ver) ある生物学の実験で,
10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 が65であるか検定しましょう. 有意水準は 5%(両側検定)とします. ※本問において, 母平均が分からないのに母分散が分かっているというのは都合が良いように感じられ ます. 次は, 母分散も分かっていないケースを考えましょう.
母平均の検定(母分散未知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:??? • 標準偏差:??? の正規分布となります. ➡ 観測で得られた標本平均 60.4 の標準化を先ほどのように行うことができません. そこで今回, 母標準偏差 の代わりに標本標準偏差 を使用して標準化することを考えましょう.
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) ではなく で標準化します. これを Student化 と呼びます. Student化で得られたデータはもはや標準正規分布に従いません. その代わりに, 自由度 の t分布 に従うことが知られています.
母平均の区間推定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. が自由度 9 の t分布 に従います. 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は
母平均の検定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 が62であるか検定しましょう. 有意水準は 5%(両側検定)とします. 62 は母平均 の95%信頼区間 に入っています. これは, が -1.96以上1.96以下の範囲に入っている(=棄却域に入らない)ことを意味します. よって, 母平均 が62である仮説は棄却されません. ( が62であることが妥当であると判断したわけではないことに注意)
まとめ • 標本分散を計算する際は, n ではなく n-1 で割ることに注意しましょう. • 複数データの平均値は1個のデータより分散が小さくなります. そのため,
標本のサンプルサイズを大きくすることは重要です. • 母平均の区間推定 ◦ 母分散が既知の場合 が標準正規分布に従うことを利用しましょう ◦ 母分散が未知の場合 が自由度 n-1 の t分布 に従うことを利用しましょう.
演習問題を解こう!