Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Webサービス開発に必要な統計学入門 / study of statistics for we...
Search
yudppp
July 26, 2019
Education
1
290
Webサービス開発に必要な統計学入門 / study of statistics for web developers
社内勉強会にて簡単に統計学について話しました。
統計学を身近に感じてもらいたかった資料です。
yudppp
July 26, 2019
Tweet
Share
More Decks by yudppp
See All by yudppp
型安全なDrag and Dropの設計を考える
yudppp
5
810
未知のプログラミング言語にChatGPTと共に挑む
yudppp
0
450
SaaSフロントエンド開発の現場で求められる技術 / Technologies for SaaS Frontend Development in the Field
yudppp
2
200
2019年 HRBrainの技術的挑戦 / hrbain technology challenge 2019
yudppp
3
1.3k
Web開発を支えるマイグレーションツールについて / sqldef introduction for psql users
yudppp
2
3.3k
ISUCON向けのツールを作った話 / isutools
yudppp
1
280
Row Level Securityはマルチテナントの銀の弾丸になりうるのか / Row Level Security is silver bullet for multitenancy?
yudppp
22
31k
メジャーな Live Reloaderの違いをちゃんと調べて見た / Compare major live reloader of Go
yudppp
1
1.9k
今年お世話になったnpm module
yudppp
1
920
Other Decks in Education
See All in Education
質のよいアウトプットをできるようになるために~「読む・聞く、まとめる、言葉にする」を読んで~
amarelo_n24
0
200
Avoin jakaminen ja Creative Commons -lisenssit
matleenalaakso
0
1.9k
教える側は、初学者に谷越えまで伴走すべき(ダニング・クルーガー効果からの考察)
hysmrk
3
110
バックオフィス組織にも「チームトポロジー」の考えが使えるかもしれない!!
masakiokuda
0
120
予習動画
takenawa
0
14k
2026 g0v 零時政府年會啟動提案 / g0v Summit 2026 Kickstart
rschiang
0
150
2025/06/05_読み漁り学習
nag8
0
190
AWSと共に英語を学ぼう
amarelo_n24
0
130
万博非公式マップとFOSS4G
barsaka2
0
860
20250625_なんでもCopilot 一年の振り返り
ponponmikankan
0
330
OJTに夢を見すぎていませんか? ロールプレイ研修の試行錯誤/tryanderror-in-roleplaying-training
takipone
1
210
American Airlines® USA Contact Numbers: The Ultimate 2025 Guide
lievliev
0
250
Featured
See All Featured
Writing Fast Ruby
sferik
628
62k
Speed Design
sergeychernyshev
32
1.1k
Raft: Consensus for Rubyists
vanstee
140
7.1k
Become a Pro
speakerdeck
PRO
29
5.5k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
183
54k
Imperfection Machines: The Place of Print at Facebook
scottboms
268
13k
[RailsConf 2023] Rails as a piece of cake
palkan
56
5.8k
Rebuilding a faster, lazier Slack
samanthasiow
83
9.1k
Scaling GitHub
holman
462
140k
Building Adaptive Systems
keathley
43
2.7k
Agile that works and the tools we love
rasmusluckow
329
21k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
Transcript
Webサービス開発に 必要な統計学⼊⾨ HRBrain社内勉強会(15min)
⾃⼰紹介 • @yudppp • 株式会社HRBrain CTO • 好きな⾔葉: 冪等性 •
Go / React / TypeScript • ◦△□ - https://blog.yudppp.com/
アジェンダ • なぜ統計学が必要か • 尺度 • 正規分布 • データの代表値 •
ペーパーテスト • 丸つけ / 解説
なぜ統計学が必要か • 選挙の当確を早く出せる • ⽐例代表が当確が遅いのはなぜか(政治学科 卒の⽅に聞く) • 開票率1%で当選確実を出している • 1%て少なくないか
スープの味⾒をするときに どのくらい飲みますか?
私は しっかり混ぜてから ⼀⼝分飲みます
統計学的にも しっかり混ぜてから 飲むのが⼤事 (無作為抽出?)
前置きは以上で本題
尺度
None
最近仕事中にたくさん使って ます。
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ࣭తσʔλ ྔతσʔλ
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ঃʑʹৄࡉ͕૿͍͖ͯ͠·͢
名義尺度(nominal scale) • 単に他と区別された分類 • 例 • 職種(Sales/CustomerSuccess/Engineer) • ⾎液型(A型/B型/O型AB型)
順序尺度(ordinal scale) • 順序をもつ尺度 • 例 • 職種(Assistant Producer/Producer/Executive Producer)
• 評価(S評価/A評価/B評価/C評価/D評価) • グレード(P1/P2/P3/P4/P5) • 順位(1位/2位/3位)
間隔尺度(interval scale) • ⽬盛りが等間隔になっている尺度 • 例 • 評価(10点満点) • PageSpeed
Insightsのスコア • 摂⽒温度 • ⻄暦
⽐例尺度(ratio scale) • ゼロを基点に間隔や⽐率にも意味がある尺度 • 例 • ⾝⻑ • 年齢
• レスポンス時間
よくある間違い • 間隔尺度と⽐例尺度を間違う • ◯倍するみたいなことができたら⽐例尺度 • 20℃は10℃の2倍暑いと⾔えるか • 順序尺度と間隔尺度を間違う •
間隔が等しいかを考える
なぜ尺度が有⽤か • 尺度の種類によってどんなグラフにすべきか が決まる。 • 尺度によって使える代表値が変わる。(代表値 については後で)
正規分布
突然なのですが 私は中学⽣の時に 英語の偏差値が50でした。
偏差値が50の時は 100⼈中 上から何番⽬でしょうか?
50番⽬か51番⽬です。
そして 国語の偏差値が40でした。
偏差値が40の時は 100⼈中 下から何番⽬でしょうか?
15番⽬か16番⽬です。
偏差値 20 30 40 50 60 70 80
偏差値は 平均値が50 標準偏差が10 の正規分布
正規分布(normal distribution)
使われ⽅ • 検定していくのに必要 • JMeterのタイマーとかに正規分布使われてい る • https://jmeter.apache.org/usermanual/ component_reference.html#timers
データの代表値
データを代表する値 というのがあります
例えば 最⼩値・最⼤値・平均値?
平均値(mean) • データの総和をデータ件数で割った値 • [1, 1, 2, 3, 5] =>
(1 + 1 + 2 + 3 + 5) / 5 = 2.4
中央値(median) • データを昇順(降順)に並べた時に中央にくる値 • 奇数の時 • [1, 1, 2, 3,
5] => 2 • 偶数の時 • [1, 1, 2, 3, 5, 8] => (2 + 3) / 2
最頻値(mode) • 最も頻繁に出現した値 • [1, 1, 2, 3, 5] =>
1 • 複数の時もある。 • [1, 1, 2, 2, 5] => 1, 2
正規分布は 平均値=中央値=最頻値 となる
代表値と尺度の関係 • 質的データ(名義尺度,順序尺度)は最頻値しか 取れない • 量的データ(間隔尺度,⽐例尺度)は最頻値、平 均値、中央値が取れる
まとめ • 今回話した話は統計学の⼊⾨者向けの参考書 の⼀章と⼆章にあたるような内容です。 • この先の検定⼿法については個⼈的に調べる か聞いてください。
参考資料 • https://science.sciencemag.org/content/103/2684/677