Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Webサービス開発に必要な統計学入門 / study of statistics for we...
Search
yudppp
July 26, 2019
Education
1
290
Webサービス開発に必要な統計学入門 / study of statistics for web developers
社内勉強会にて簡単に統計学について話しました。
統計学を身近に感じてもらいたかった資料です。
yudppp
July 26, 2019
Tweet
Share
More Decks by yudppp
See All by yudppp
型安全なDrag and Dropの設計を考える
yudppp
5
790
未知のプログラミング言語にChatGPTと共に挑む
yudppp
0
440
SaaSフロントエンド開発の現場で求められる技術 / Technologies for SaaS Frontend Development in the Field
yudppp
2
190
2019年 HRBrainの技術的挑戦 / hrbain technology challenge 2019
yudppp
3
1.3k
Web開発を支えるマイグレーションツールについて / sqldef introduction for psql users
yudppp
2
3.3k
ISUCON向けのツールを作った話 / isutools
yudppp
1
270
Row Level Securityはマルチテナントの銀の弾丸になりうるのか / Row Level Security is silver bullet for multitenancy?
yudppp
21
31k
メジャーな Live Reloaderの違いをちゃんと調べて見た / Compare major live reloader of Go
yudppp
1
1.9k
今年お世話になったnpm module
yudppp
1
920
Other Decks in Education
See All in Education
推しのコミュニティはなんぼあってもいい / Let's join a lot of communities.
kaga
2
1.8k
2025年度春学期 統計学 第10回 分布の推測とは ー 標本調査,度数分布と確率分布 (2025. 6. 12)
akiraasano
PRO
0
200
American Airlines® USA Contact Numbers: The Ultimate 2025 Guide
lievliev
0
240
日本の教育の未来 を考える テクノロジーは教育をどのように変えるのか
kzkmaeda
1
220
人になにかを教えるときに考えていること(2025-05版 / VRC-LT #18)
sksat
4
1.1k
サンキッズゾーン 春日井駅前 ご案内
sanyohomes
0
610
Alumnote inc. Company Deck
yukinumata
0
940
理想の英語力に一直線!最高効率な英語学習のすゝめ
logica0419
6
310
IMU-00 Pi
kanaya
0
380
20250625_なんでもCopilot 一年の振り返り
ponponmikankan
0
290
2025年度春学期 統計学 第2回 統計資料の収集と読み方(講義後配付用) (2025. 4. 17)
akiraasano
PRO
0
120
ビジネスモデル理解
takenawa
0
11k
Featured
See All Featured
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Done Done
chrislema
185
16k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
860
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
21k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.3k
Mobile First: as difficult as doing things right
swwweet
223
9.8k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
8
410
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.8k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Producing Creativity
orderedlist
PRO
346
40k
Transcript
Webサービス開発に 必要な統計学⼊⾨ HRBrain社内勉強会(15min)
⾃⼰紹介 • @yudppp • 株式会社HRBrain CTO • 好きな⾔葉: 冪等性 •
Go / React / TypeScript • ◦△□ - https://blog.yudppp.com/
アジェンダ • なぜ統計学が必要か • 尺度 • 正規分布 • データの代表値 •
ペーパーテスト • 丸つけ / 解説
なぜ統計学が必要か • 選挙の当確を早く出せる • ⽐例代表が当確が遅いのはなぜか(政治学科 卒の⽅に聞く) • 開票率1%で当選確実を出している • 1%て少なくないか
スープの味⾒をするときに どのくらい飲みますか?
私は しっかり混ぜてから ⼀⼝分飲みます
統計学的にも しっかり混ぜてから 飲むのが⼤事 (無作為抽出?)
前置きは以上で本題
尺度
None
最近仕事中にたくさん使って ます。
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ࣭తσʔλ ྔతσʔλ
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ঃʑʹৄࡉ͕૿͍͖ͯ͠·͢
名義尺度(nominal scale) • 単に他と区別された分類 • 例 • 職種(Sales/CustomerSuccess/Engineer) • ⾎液型(A型/B型/O型AB型)
順序尺度(ordinal scale) • 順序をもつ尺度 • 例 • 職種(Assistant Producer/Producer/Executive Producer)
• 評価(S評価/A評価/B評価/C評価/D評価) • グレード(P1/P2/P3/P4/P5) • 順位(1位/2位/3位)
間隔尺度(interval scale) • ⽬盛りが等間隔になっている尺度 • 例 • 評価(10点満点) • PageSpeed
Insightsのスコア • 摂⽒温度 • ⻄暦
⽐例尺度(ratio scale) • ゼロを基点に間隔や⽐率にも意味がある尺度 • 例 • ⾝⻑ • 年齢
• レスポンス時間
よくある間違い • 間隔尺度と⽐例尺度を間違う • ◯倍するみたいなことができたら⽐例尺度 • 20℃は10℃の2倍暑いと⾔えるか • 順序尺度と間隔尺度を間違う •
間隔が等しいかを考える
なぜ尺度が有⽤か • 尺度の種類によってどんなグラフにすべきか が決まる。 • 尺度によって使える代表値が変わる。(代表値 については後で)
正規分布
突然なのですが 私は中学⽣の時に 英語の偏差値が50でした。
偏差値が50の時は 100⼈中 上から何番⽬でしょうか?
50番⽬か51番⽬です。
そして 国語の偏差値が40でした。
偏差値が40の時は 100⼈中 下から何番⽬でしょうか?
15番⽬か16番⽬です。
偏差値 20 30 40 50 60 70 80
偏差値は 平均値が50 標準偏差が10 の正規分布
正規分布(normal distribution)
使われ⽅ • 検定していくのに必要 • JMeterのタイマーとかに正規分布使われてい る • https://jmeter.apache.org/usermanual/ component_reference.html#timers
データの代表値
データを代表する値 というのがあります
例えば 最⼩値・最⼤値・平均値?
平均値(mean) • データの総和をデータ件数で割った値 • [1, 1, 2, 3, 5] =>
(1 + 1 + 2 + 3 + 5) / 5 = 2.4
中央値(median) • データを昇順(降順)に並べた時に中央にくる値 • 奇数の時 • [1, 1, 2, 3,
5] => 2 • 偶数の時 • [1, 1, 2, 3, 5, 8] => (2 + 3) / 2
最頻値(mode) • 最も頻繁に出現した値 • [1, 1, 2, 3, 5] =>
1 • 複数の時もある。 • [1, 1, 2, 2, 5] => 1, 2
正規分布は 平均値=中央値=最頻値 となる
代表値と尺度の関係 • 質的データ(名義尺度,順序尺度)は最頻値しか 取れない • 量的データ(間隔尺度,⽐例尺度)は最頻値、平 均値、中央値が取れる
まとめ • 今回話した話は統計学の⼊⾨者向けの参考書 の⼀章と⼆章にあたるような内容です。 • この先の検定⼿法については個⼈的に調べる か聞いてください。
参考資料 • https://science.sciencemag.org/content/103/2684/677