Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Webサービス開発に必要な統計学入門 / study of statistics for we...
Search
yudppp
July 26, 2019
Education
1
240
Webサービス開発に必要な統計学入門 / study of statistics for web developers
社内勉強会にて簡単に統計学について話しました。
統計学を身近に感じてもらいたかった資料です。
yudppp
July 26, 2019
Tweet
Share
More Decks by yudppp
See All by yudppp
未知のプログラミング言語にChatGPTと共に挑む
yudppp
0
310
SaaSフロントエンド開発の現場で求められる技術 / Technologies for SaaS Frontend Development in the Field
yudppp
2
99
2019年 HRBrainの技術的挑戦 / hrbain technology challenge 2019
yudppp
3
1.2k
Web開発を支えるマイグレーションツールについて / sqldef introduction for psql users
yudppp
2
3.1k
ISUCON向けのツールを作った話 / isutools
yudppp
1
230
Row Level Securityはマルチテナントの銀の弾丸になりうるのか / Row Level Security is silver bullet for multitenancy?
yudppp
20
24k
メジャーな Live Reloaderの違いをちゃんと調べて見た / Compare major live reloader of Go
yudppp
1
1.8k
今年お世話になったnpm module
yudppp
1
860
Goで社内向け管理画面を楽に作る方法
yudppp
5
10k
Other Decks in Education
See All in Education
小・中・高等学校における情報教育の体系的な学習を目指したカリキュラムモデル案/curriculum model
codeforeveryone
2
2.3k
Comment aborder et contribuer sereinement à un projet open source ? (Masterclass Université Toulouse III)
pylapp
0
3.2k
The Gender Gap in the Technology Field and Efforts to Address It
codeforeveryone
0
210
Master of Applied Science & Engineering: Computer Science & Master of Science in Applied Informatics
signer
PRO
0
430
オープンソース防災教育ARアプリの開発と地域防災での活用
nro2daisuke
0
170
Beispiel einer Fortbildung für "Soziales Lernen"
gsgoethe
0
120
2409_CompanyInfo_Hanji_published.pdf
yosukemurata
0
380
20241002_Copilotって何?+Power_AutomateのCopilot
ponponmikankan
1
160
Repaso electricidade e electrónica
irocho
0
200
JavaScript - Lecture 6 - Web Technologies (1019888BNR)
signer
PRO
0
2.5k
1030
cbtlibrary
0
300
勉強する必要ある?
mineo_matsuya
2
1.6k
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
50
7.2k
Into the Great Unknown - MozCon
thekraken
32
1.5k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.3k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
Writing Fast Ruby
sferik
627
61k
The World Runs on Bad Software
bkeepers
PRO
65
11k
Rails Girls Zürich Keynote
gr2m
94
13k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
27
840
Raft: Consensus for Rubyists
vanstee
136
6.6k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
48k
Transcript
Webサービス開発に 必要な統計学⼊⾨ HRBrain社内勉強会(15min)
⾃⼰紹介 • @yudppp • 株式会社HRBrain CTO • 好きな⾔葉: 冪等性 •
Go / React / TypeScript • ◦△□ - https://blog.yudppp.com/
アジェンダ • なぜ統計学が必要か • 尺度 • 正規分布 • データの代表値 •
ペーパーテスト • 丸つけ / 解説
なぜ統計学が必要か • 選挙の当確を早く出せる • ⽐例代表が当確が遅いのはなぜか(政治学科 卒の⽅に聞く) • 開票率1%で当選確実を出している • 1%て少なくないか
スープの味⾒をするときに どのくらい飲みますか?
私は しっかり混ぜてから ⼀⼝分飲みます
統計学的にも しっかり混ぜてから 飲むのが⼤事 (無作為抽出?)
前置きは以上で本題
尺度
None
最近仕事中にたくさん使って ます。
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ࣭తσʔλ ྔతσʔλ
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ঃʑʹৄࡉ͕૿͍͖ͯ͠·͢
名義尺度(nominal scale) • 単に他と区別された分類 • 例 • 職種(Sales/CustomerSuccess/Engineer) • ⾎液型(A型/B型/O型AB型)
順序尺度(ordinal scale) • 順序をもつ尺度 • 例 • 職種(Assistant Producer/Producer/Executive Producer)
• 評価(S評価/A評価/B評価/C評価/D評価) • グレード(P1/P2/P3/P4/P5) • 順位(1位/2位/3位)
間隔尺度(interval scale) • ⽬盛りが等間隔になっている尺度 • 例 • 評価(10点満点) • PageSpeed
Insightsのスコア • 摂⽒温度 • ⻄暦
⽐例尺度(ratio scale) • ゼロを基点に間隔や⽐率にも意味がある尺度 • 例 • ⾝⻑ • 年齢
• レスポンス時間
よくある間違い • 間隔尺度と⽐例尺度を間違う • ◯倍するみたいなことができたら⽐例尺度 • 20℃は10℃の2倍暑いと⾔えるか • 順序尺度と間隔尺度を間違う •
間隔が等しいかを考える
なぜ尺度が有⽤か • 尺度の種類によってどんなグラフにすべきか が決まる。 • 尺度によって使える代表値が変わる。(代表値 については後で)
正規分布
突然なのですが 私は中学⽣の時に 英語の偏差値が50でした。
偏差値が50の時は 100⼈中 上から何番⽬でしょうか?
50番⽬か51番⽬です。
そして 国語の偏差値が40でした。
偏差値が40の時は 100⼈中 下から何番⽬でしょうか?
15番⽬か16番⽬です。
偏差値 20 30 40 50 60 70 80
偏差値は 平均値が50 標準偏差が10 の正規分布
正規分布(normal distribution)
使われ⽅ • 検定していくのに必要 • JMeterのタイマーとかに正規分布使われてい る • https://jmeter.apache.org/usermanual/ component_reference.html#timers
データの代表値
データを代表する値 というのがあります
例えば 最⼩値・最⼤値・平均値?
平均値(mean) • データの総和をデータ件数で割った値 • [1, 1, 2, 3, 5] =>
(1 + 1 + 2 + 3 + 5) / 5 = 2.4
中央値(median) • データを昇順(降順)に並べた時に中央にくる値 • 奇数の時 • [1, 1, 2, 3,
5] => 2 • 偶数の時 • [1, 1, 2, 3, 5, 8] => (2 + 3) / 2
最頻値(mode) • 最も頻繁に出現した値 • [1, 1, 2, 3, 5] =>
1 • 複数の時もある。 • [1, 1, 2, 2, 5] => 1, 2
正規分布は 平均値=中央値=最頻値 となる
代表値と尺度の関係 • 質的データ(名義尺度,順序尺度)は最頻値しか 取れない • 量的データ(間隔尺度,⽐例尺度)は最頻値、平 均値、中央値が取れる
まとめ • 今回話した話は統計学の⼊⾨者向けの参考書 の⼀章と⼆章にあたるような内容です。 • この先の検定⼿法については個⼈的に調べる か聞いてください。
参考資料 • https://science.sciencemag.org/content/103/2684/677