Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Webサービス開発に必要な統計学入門 / study of statistics for we...
Search
yudppp
July 26, 2019
Education
1
330
Webサービス開発に必要な統計学入門 / study of statistics for web developers
社内勉強会にて簡単に統計学について話しました。
統計学を身近に感じてもらいたかった資料です。
yudppp
July 26, 2019
Tweet
Share
More Decks by yudppp
See All by yudppp
型安全なDrag and Dropの設計を考える
yudppp
5
930
未知のプログラミング言語にChatGPTと共に挑む
yudppp
0
480
SaaSフロントエンド開発の現場で求められる技術 / Technologies for SaaS Frontend Development in the Field
yudppp
2
240
2019年 HRBrainの技術的挑戦 / hrbain technology challenge 2019
yudppp
3
1.4k
Web開発を支えるマイグレーションツールについて / sqldef introduction for psql users
yudppp
2
3.5k
ISUCON向けのツールを作った話 / isutools
yudppp
1
310
Row Level Securityはマルチテナントの銀の弾丸になりうるのか / Row Level Security is silver bullet for multitenancy?
yudppp
23
32k
メジャーな Live Reloaderの違いをちゃんと調べて見た / Compare major live reloader of Go
yudppp
1
1.9k
今年お世話になったnpm module
yudppp
1
940
Other Decks in Education
See All in Education
IHLヘルスケアリーダーシップ研究会17期説明資料
ihlhealthcareleadership
0
710
Going over the Edge
jonoalderson
0
320
Requirements Analysis and Prototyping - Lecture 3 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.4k
AIを使って最新研究 について調べて発表しよ う!
mickey_kubo
4
190
1014
cbtlibrary
0
520
The Next Big Step Toward Nuclear Disarmament
hide2kano
0
200
20251119 如果是勇者欣美爾的話, 他會怎麼做? 東海資工
pichuang
0
170
SJRC 2526
cbtlibrary
0
190
子どものためのプログラミング道場『CoderDojo』〜法人提携例〜 / Partnership with CoderDojo Japan
coderdojojapan
PRO
4
18k
卒論の書き方 / Happy Writing
kaityo256
PRO
54
28k
MySmartSTEAM 2526
cbtlibrary
0
180
HCI and Interaction Design - Lecture 2 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.5k
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
It's Worth the Effort
3n
188
29k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
300
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
900
So, you think you're a good person
axbom
PRO
2
1.9k
A Tale of Four Properties
chriscoyier
162
24k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
240
ラッコキーワード サービス紹介資料
rakko
1
2.1M
Skip the Path - Find Your Career Trail
mkilby
0
49
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Transcript
Webサービス開発に 必要な統計学⼊⾨ HRBrain社内勉強会(15min)
⾃⼰紹介 • @yudppp • 株式会社HRBrain CTO • 好きな⾔葉: 冪等性 •
Go / React / TypeScript • ◦△□ - https://blog.yudppp.com/
アジェンダ • なぜ統計学が必要か • 尺度 • 正規分布 • データの代表値 •
ペーパーテスト • 丸つけ / 解説
なぜ統計学が必要か • 選挙の当確を早く出せる • ⽐例代表が当確が遅いのはなぜか(政治学科 卒の⽅に聞く) • 開票率1%で当選確実を出している • 1%て少なくないか
スープの味⾒をするときに どのくらい飲みますか?
私は しっかり混ぜてから ⼀⼝分飲みます
統計学的にも しっかり混ぜてから 飲むのが⼤事 (無作為抽出?)
前置きは以上で本題
尺度
None
最近仕事中にたくさん使って ます。
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ࣭తσʔλ ྔతσʔλ
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ঃʑʹৄࡉ͕૿͍͖ͯ͠·͢
名義尺度(nominal scale) • 単に他と区別された分類 • 例 • 職種(Sales/CustomerSuccess/Engineer) • ⾎液型(A型/B型/O型AB型)
順序尺度(ordinal scale) • 順序をもつ尺度 • 例 • 職種(Assistant Producer/Producer/Executive Producer)
• 評価(S評価/A評価/B評価/C評価/D評価) • グレード(P1/P2/P3/P4/P5) • 順位(1位/2位/3位)
間隔尺度(interval scale) • ⽬盛りが等間隔になっている尺度 • 例 • 評価(10点満点) • PageSpeed
Insightsのスコア • 摂⽒温度 • ⻄暦
⽐例尺度(ratio scale) • ゼロを基点に間隔や⽐率にも意味がある尺度 • 例 • ⾝⻑ • 年齢
• レスポンス時間
よくある間違い • 間隔尺度と⽐例尺度を間違う • ◯倍するみたいなことができたら⽐例尺度 • 20℃は10℃の2倍暑いと⾔えるか • 順序尺度と間隔尺度を間違う •
間隔が等しいかを考える
なぜ尺度が有⽤か • 尺度の種類によってどんなグラフにすべきか が決まる。 • 尺度によって使える代表値が変わる。(代表値 については後で)
正規分布
突然なのですが 私は中学⽣の時に 英語の偏差値が50でした。
偏差値が50の時は 100⼈中 上から何番⽬でしょうか?
50番⽬か51番⽬です。
そして 国語の偏差値が40でした。
偏差値が40の時は 100⼈中 下から何番⽬でしょうか?
15番⽬か16番⽬です。
偏差値 20 30 40 50 60 70 80
偏差値は 平均値が50 標準偏差が10 の正規分布
正規分布(normal distribution)
使われ⽅ • 検定していくのに必要 • JMeterのタイマーとかに正規分布使われてい る • https://jmeter.apache.org/usermanual/ component_reference.html#timers
データの代表値
データを代表する値 というのがあります
例えば 最⼩値・最⼤値・平均値?
平均値(mean) • データの総和をデータ件数で割った値 • [1, 1, 2, 3, 5] =>
(1 + 1 + 2 + 3 + 5) / 5 = 2.4
中央値(median) • データを昇順(降順)に並べた時に中央にくる値 • 奇数の時 • [1, 1, 2, 3,
5] => 2 • 偶数の時 • [1, 1, 2, 3, 5, 8] => (2 + 3) / 2
最頻値(mode) • 最も頻繁に出現した値 • [1, 1, 2, 3, 5] =>
1 • 複数の時もある。 • [1, 1, 2, 2, 5] => 1, 2
正規分布は 平均値=中央値=最頻値 となる
代表値と尺度の関係 • 質的データ(名義尺度,順序尺度)は最頻値しか 取れない • 量的データ(間隔尺度,⽐例尺度)は最頻値、平 均値、中央値が取れる
まとめ • 今回話した話は統計学の⼊⾨者向けの参考書 の⼀章と⼆章にあたるような内容です。 • この先の検定⼿法については個⼈的に調べる か聞いてください。
参考資料 • https://science.sciencemag.org/content/103/2684/677