Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計学入門講座 第6回スライド
Search
TechmathProject
August 11, 2025
Science
0
10
統計学入門講座 第6回スライド
てくますプロジェクトで行った統計学入門講座の第6回スライドです。
実施:2025/01/06
TechmathProject
August 11, 2025
Tweet
Share
More Decks by TechmathProject
See All by TechmathProject
統計学入門講座 第5回スライド
techmathproject
0
28
統計学入門講座 第7回スライド
techmathproject
0
10
統計学入門講座 第8回スライド
techmathproject
0
9
統計学入門講座 第4回スライド
techmathproject
0
190
統計学入門講座 第3回スライド
techmathproject
0
130
統計学入門講座 第2回スライド
techmathproject
0
190
統計学入門講座 第1回スライド
techmathproject
0
460
線形代数学入門講座 第1回スライド
techmathproject
0
120
線形代数学入門講座 第2回スライド
techmathproject
0
82
Other Decks in Science
See All in Science
蔵本モデルが解き明かす同期と相転移の秘密 〜拍手のリズムはなぜ揃うのか?〜
syotasasaki593876
0
100
academist Prize 4期生 研究トーク延長戦!「美は世界を救う」っていうけど、どうやって?
jimpe_hitsuwari
0
320
データマイニング - コミュニティ発見
trycycle
PRO
0
160
データベース03: 関係データモデル
trycycle
PRO
1
270
データベース15: ビッグデータ時代のデータベース
trycycle
PRO
0
360
デジタルアーカイブの教育利用促進を目指したメタデータLOD基盤に関する研究 / Research on a Metadata LOD Platform for Promoting Educational Uses of Digital Archives
masao
0
100
Optimization of the Tournament Format for the Nationwide High School Kyudo Competition in Japan
konakalab
0
100
05_山中真也_室蘭工業大学大学院工学研究科教授_だてプロの挑戦.pdf
sip3ristex
0
660
AIに仕事を奪われる 最初の医師たちへ
ikora128
0
980
My Little Monster
juzishuu
0
120
アナログ計算機『計算尺』を愛でる Midosuji Tech #4/Analog Computing Device Slide Rule now and then
quiver
1
290
CV_3_Keypoints
hachama
0
210
Featured
See All Featured
The Power of CSS Pseudo Elements
geoffreycrofte
79
6k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
The Invisible Side of Design
smashingmag
301
51k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
We Have a Design System, Now What?
morganepeng
53
7.8k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.5k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.5k
Building an army of robots
kneath
306
46k
The Language of Interfaces
destraynor
162
25k
Making Projects Easy
brettharned
119
6.4k
Git: the NoSQL Database
bkeepers
PRO
431
66k
Transcript
統計学入門講座 第6回 母平均の検定 てくますプロジェクト
てくますプロジェクトについて • てくますプロジェクトは, 「考える楽しさを探そう!」が合言葉の, 数学と情報科学の学習コミュニティです. • 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために,
私たちは活動しています. • 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. • X などで宣伝いただけると大変嬉しいです. (#てくますプロジェクト) • 講師はゆっきん(桑原)が担当します. ◦ 数学教師→システムエンジニア→プログラミング講師 ◦ 数学, プログラミング, ボードゲームが好きです. ◦ てくますプロジェクトやボードゲームコミュニティの運営を 行っています.
本講座について • 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定2級を目指す方にも適した内容です. • 本講座は各回, 前半で知識のインプット,
後半で問題演習を行います. • 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください! • 本講座作成にあたり, 特に参考にした本を 右に挙げておきます. 2冊ともオススメです. • 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.
スケジュール 第1回 データの整理 2024/10/07 第4回 確率分布 2024/12/02 第3回 確率の基本 2024/11/18
第2回 データの散らばり 2024/10/28 第5回 検定の枠組み 2024/12/16 第8回 2標本t検定 2025/02/10 第6回 母平均の検定 2025/01/06 第7回 母分散, 母比率の検定 2025/01/27 本講座は全8回です. 各回の内容は以下の通りです.
目次 1. 母集団と標本 母平均の検定に入る前に, 母集団と標本に関するいくつかのトピックを紹介します. 2. 母平均の検定(母分散既知ver) 母分散が分かっている状態で母平均を検定する方法を学びます. 3. 母平均の検定(母分散未知ver)
母分散が分かっていない状態で母平均を検定する方法を学びます.
母集団と標本
区間推定と信頼区間 母集団 標本 抽出 推測 知りたい • 母平均 • 母分散
• 母標準偏差 • 母比率 計算できる • 標本平均 • 標本分散 • 標本標準偏差 • 標本比率 母平均や母分散などの母数を区間で推測することを区間推定といいます. また, 信頼区間とは, 区間推定の結果得られる「母数が含まれている可能性の高い範囲」のことをいい ます. 例えば, 母平均の95%信頼区間の場合, 「この計算方法を繰り返したとき, 95%の確率で母平均が信頼区 間に含まれる」ことを意味します. 今日のテーマ!
標本分散について 母分散と標本分散は計算方法が異なることに注意が必要です. 母分散:偏差(母平均からの差)の2乗の和をデータ数で割った値(つまり偏差の2乗の平均値) 標本分散:偏差(標本平均からの差)の2乗の和を データ数 - 1 で割った値 標本平均: 標本分散:
標本標準偏差: 偏差の自由度の数 =意味のある偏差の数 ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65
複数データの平均値は1個のデータより分散が小さくなる さいころ投げにおいて出る目の母平均は 3.5 です. さいころを投げる試行を1回行ったとき 出る目の期待値:3.5 出る目の分散: さいころを投げる試行を2回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散:
さいころを投げる試行をn回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散: n個のデータの平均値の分散は 1個のデータの分散の 倍
複数データの平均値は1個のデータより分散が小さくなる 分散が小さくなれば, 予測の範囲を狭めることができます. そのことを確かめましょう. ある母集団は母平均100, 母標準偏差20の正規分布に従います. この母集団からデータを抽出します. (1) 標本サイズ16の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか
(2) 標本サイズ64の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか. (1) 標本平均 の分布は, 平均値100, 標準偏差 20/√16=5 の 正規分布です. (2) 標本平均 の分布は, 平均値100, 標準偏差 20/√64=2.5 の 正規分布です. 予測の範囲が狭くなりました
母平均の検定(母分散既知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散既知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:母分散 をサンプルサイズで割った値なので, 12÷10=1.2 • 標準偏差:√1.2≒1.095 の正規分布となります. 観測で得られた標本平均は, このデータを標準化すると,
母平均の区間推定(母分散既知ver) 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62,
58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう.
65 は母平均 の95%信頼区間 に入っていません. これは, が -1.96以上1.96以下の範囲に入っていない(=棄却域に入る)ことを意味します. よって, 母平均 が65である仮説は棄却されます. 母平均の検定(母分散既知ver) ある生物学の実験で,
10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 が65であるか検定しましょう. 有意水準は 5%(両側検定)とします. ※本問において, 母平均が分からないのに母分散が分かっているというのは都合が良いように感じられ ます. 次は, 母分散も分かっていないケースを考えましょう.
母平均の検定(母分散未知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:??? • 標準偏差:??? の正規分布となります. ➡ 観測で得られた標本平均 60.4 の標準化を先ほどのように行うことができません. そこで今回, 母標準偏差 の代わりに標本標準偏差 を使用して標準化することを考えましょう.
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) ではなく で標準化します. これを Student化 と呼びます. Student化で得られたデータはもはや標準正規分布に従いません. その代わりに, 自由度 の t分布 に従うことが知られています.
母平均の区間推定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. が自由度 9 の t分布 に従います. 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は
母平均の検定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 が62であるか検定しましょう. 有意水準は 5%(両側検定)とします. 62 は母平均 の95%信頼区間 に入っています. これは, が -1.96以上1.96以下の範囲に入っている(=棄却域に入らない)ことを意味します. よって, 母平均 が62である仮説は棄却されません. ( が62であることが妥当であると判断したわけではないことに注意)
まとめ • 標本分散を計算する際は, n ではなく n-1 で割ることに注意しましょう. • 複数データの平均値は1個のデータより分散が小さくなります. そのため,
標本のサンプルサイズを大きくすることは重要です. • 母平均の区間推定 ◦ 母分散が既知の場合 が標準正規分布に従うことを利用しましょう ◦ 母分散が未知の場合 が自由度 n-1 の t分布 に従うことを利用しましょう.
演習問題を解こう!