Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計学入門講座 第6回スライド
Search
TechmathProject
August 11, 2025
Science
0
8
統計学入門講座 第6回スライド
てくますプロジェクトで行った統計学入門講座の第6回スライドです。
実施:2025/01/06
TechmathProject
August 11, 2025
Tweet
Share
More Decks by TechmathProject
See All by TechmathProject
統計学入門講座 第5回スライド
techmathproject
0
24
統計学入門講座 第7回スライド
techmathproject
0
9
統計学入門講座 第8回スライド
techmathproject
0
7
統計学入門講座 第4回スライド
techmathproject
0
180
統計学入門講座 第3回スライド
techmathproject
0
120
統計学入門講座 第2回スライド
techmathproject
0
180
統計学入門講座 第1回スライド
techmathproject
0
440
線形代数学入門講座 第1回スライド
techmathproject
0
110
線形代数学入門講座 第2回スライド
techmathproject
0
76
Other Decks in Science
See All in Science
KH Coderチュートリアル(スライド版)
koichih
1
46k
システム数理と応用分野の未来を切り拓くロードマップ・エンターテインメント(スポーツ)への応用 / Applied mathematics for sports entertainment
konakalab
1
390
白金鉱業Meetup Vol.16_数理最適化案件のはじめかた・すすめかた
brainpadpr
4
2k
安心・効率的な医療現場の実現へ ~オンプレAI & ノーコードワークフローで進める業務改革~
siyoo
0
320
[Paper Introduction] From Bytes to Ideas:Language Modeling with Autoregressive U-Nets
haruumiomoto
0
130
AIによる科学の加速: 各領域での革新と共創の未来
masayamoriofficial
0
110
データベース01: データベースを使わない世界
trycycle
PRO
1
770
baseballrによるMLBデータの抽出と階層ベイズモデルによる打率の推定 / TokyoR118
dropout009
1
560
Agent開発フレームワークのOverviewとW&B Weaveとのインテグレーション
siyoo
0
330
データベース15: ビッグデータ時代のデータベース
trycycle
PRO
0
340
データマイニング - ノードの中心性
trycycle
PRO
0
270
地質研究者が苦労しながら運用する情報公開システムの実例
naito2000
0
260
Featured
See All Featured
Done Done
chrislema
185
16k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
580
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Scaling GitHub
holman
463
140k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Faster Mobile Websites
deanohume
309
31k
Imperfection Machines: The Place of Print at Facebook
scottboms
268
13k
The Cult of Friendly URLs
andyhume
79
6.6k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
13k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
187
55k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Transcript
統計学入門講座 第6回 母平均の検定 てくますプロジェクト
てくますプロジェクトについて • てくますプロジェクトは, 「考える楽しさを探そう!」が合言葉の, 数学と情報科学の学習コミュニティです. • 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために,
私たちは活動しています. • 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. • X などで宣伝いただけると大変嬉しいです. (#てくますプロジェクト) • 講師はゆっきん(桑原)が担当します. ◦ 数学教師→システムエンジニア→プログラミング講師 ◦ 数学, プログラミング, ボードゲームが好きです. ◦ てくますプロジェクトやボードゲームコミュニティの運営を 行っています.
本講座について • 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定2級を目指す方にも適した内容です. • 本講座は各回, 前半で知識のインプット,
後半で問題演習を行います. • 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください! • 本講座作成にあたり, 特に参考にした本を 右に挙げておきます. 2冊ともオススメです. • 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.
スケジュール 第1回 データの整理 2024/10/07 第4回 確率分布 2024/12/02 第3回 確率の基本 2024/11/18
第2回 データの散らばり 2024/10/28 第5回 検定の枠組み 2024/12/16 第8回 2標本t検定 2025/02/10 第6回 母平均の検定 2025/01/06 第7回 母分散, 母比率の検定 2025/01/27 本講座は全8回です. 各回の内容は以下の通りです.
目次 1. 母集団と標本 母平均の検定に入る前に, 母集団と標本に関するいくつかのトピックを紹介します. 2. 母平均の検定(母分散既知ver) 母分散が分かっている状態で母平均を検定する方法を学びます. 3. 母平均の検定(母分散未知ver)
母分散が分かっていない状態で母平均を検定する方法を学びます.
母集団と標本
区間推定と信頼区間 母集団 標本 抽出 推測 知りたい • 母平均 • 母分散
• 母標準偏差 • 母比率 計算できる • 標本平均 • 標本分散 • 標本標準偏差 • 標本比率 母平均や母分散などの母数を区間で推測することを区間推定といいます. また, 信頼区間とは, 区間推定の結果得られる「母数が含まれている可能性の高い範囲」のことをいい ます. 例えば, 母平均の95%信頼区間の場合, 「この計算方法を繰り返したとき, 95%の確率で母平均が信頼区 間に含まれる」ことを意味します. 今日のテーマ!
標本分散について 母分散と標本分散は計算方法が異なることに注意が必要です. 母分散:偏差(母平均からの差)の2乗の和をデータ数で割った値(つまり偏差の2乗の平均値) 標本分散:偏差(標本平均からの差)の2乗の和を データ数 - 1 で割った値 標本平均: 標本分散:
標本標準偏差: 偏差の自由度の数 =意味のある偏差の数 ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65
複数データの平均値は1個のデータより分散が小さくなる さいころ投げにおいて出る目の母平均は 3.5 です. さいころを投げる試行を1回行ったとき 出る目の期待値:3.5 出る目の分散: さいころを投げる試行を2回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散:
さいころを投げる試行をn回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散: n個のデータの平均値の分散は 1個のデータの分散の 倍
複数データの平均値は1個のデータより分散が小さくなる 分散が小さくなれば, 予測の範囲を狭めることができます. そのことを確かめましょう. ある母集団は母平均100, 母標準偏差20の正規分布に従います. この母集団からデータを抽出します. (1) 標本サイズ16の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか
(2) 標本サイズ64の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか. (1) 標本平均 の分布は, 平均値100, 標準偏差 20/√16=5 の 正規分布です. (2) 標本平均 の分布は, 平均値100, 標準偏差 20/√64=2.5 の 正規分布です. 予測の範囲が狭くなりました
母平均の検定(母分散既知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散既知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:母分散 をサンプルサイズで割った値なので, 12÷10=1.2 • 標準偏差:√1.2≒1.095 の正規分布となります. 観測で得られた標本平均は, このデータを標準化すると,
母平均の区間推定(母分散既知ver) 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62,
58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう.
65 は母平均 の95%信頼区間 に入っていません. これは, が -1.96以上1.96以下の範囲に入っていない(=棄却域に入る)ことを意味します. よって, 母平均 が65である仮説は棄却されます. 母平均の検定(母分散既知ver) ある生物学の実験で,
10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 が65であるか検定しましょう. 有意水準は 5%(両側検定)とします. ※本問において, 母平均が分からないのに母分散が分かっているというのは都合が良いように感じられ ます. 次は, 母分散も分かっていないケースを考えましょう.
母平均の検定(母分散未知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:??? • 標準偏差:??? の正規分布となります. ➡ 観測で得られた標本平均 60.4 の標準化を先ほどのように行うことができません. そこで今回, 母標準偏差 の代わりに標本標準偏差 を使用して標準化することを考えましょう.
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) ではなく で標準化します. これを Student化 と呼びます. Student化で得られたデータはもはや標準正規分布に従いません. その代わりに, 自由度 の t分布 に従うことが知られています.
母平均の区間推定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. が自由度 9 の t分布 に従います. 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は
母平均の検定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 が62であるか検定しましょう. 有意水準は 5%(両側検定)とします. 62 は母平均 の95%信頼区間 に入っています. これは, が -1.96以上1.96以下の範囲に入っている(=棄却域に入らない)ことを意味します. よって, 母平均 が62である仮説は棄却されません. ( が62であることが妥当であると判断したわけではないことに注意)
まとめ • 標本分散を計算する際は, n ではなく n-1 で割ることに注意しましょう. • 複数データの平均値は1個のデータより分散が小さくなります. そのため,
標本のサンプルサイズを大きくすることは重要です. • 母平均の区間推定 ◦ 母分散が既知の場合 が標準正規分布に従うことを利用しましょう ◦ 母分散が未知の場合 が自由度 n-1 の t分布 に従うことを利用しましょう.
演習問題を解こう!