Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
私が知っておきたかった統計手法 / Statistical methods I wanted...
Search
TAKAyukiatkwsk
May 16, 2020
Technology
0
230
私が知っておきたかった統計手法 / Statistical methods I wanted to know
Kanazawa.rb meetup #93 で発表した資料です。
TAKAyukiatkwsk
May 16, 2020
Tweet
Share
More Decks by TAKAyukiatkwsk
See All by TAKAyukiatkwsk
argo-rolloutsにコミットした話
takayukiatkwsk
0
20
EnvoyのWasm filterを体験する
takayukiatkwsk
0
34
自分用趣味アプリを作っている話
takayukiatkwsk
0
74
zoxideのご紹介
takayukiatkwsk
0
82
Kanazawa.rbに参加してからのふりかえり
takayukiatkwsk
0
42
git-secretsとgitフックをざっと理解する
takayukiatkwsk
0
310
計測プラットフォームSREチームとシステム障害対応 / measurement platform SRE team's incident response
takayukiatkwsk
0
1.1k
Flutterに入門して体重グラフアプリを作る / Get started Flutter and build a weight graph app
takayukiatkwsk
0
390
リモートワークを振り返る / Look back on remote-working
takayukiatkwsk
0
110
Other Decks in Technology
See All in Technology
OPENLOGI Company Profile
hr01
0
63k
地味にいろいろあった! 2025春のAmazon Bedrockアップデートおさらい
minorun365
PRO
2
560
Databricksで完全履修!オールインワンレイクハウスは実在した!
akuwano
0
140
持続可能なドキュメント運用のリアル: 1年間の成果とこれから
akitok_
1
270
もう難しくない!誰でもカンタンDocker入門 〜30分であなたのPCにアプリを立ち上げる〜
devops_vtj
0
180
テストって楽しい!開発を加速させるテストの魅力 / Testing is Fun! The Fascinating of Testing to Accelerate Development
aiandrox
0
160
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
5.5k
Running JavaScript within Ruby
hmsk
4
440
続・やっぱり余白が大切だった話
kakehashi
PRO
2
170
GraphQLを活用したリアーキテクチャに対応するSLI/Oの再設計
coconala_engineer
0
200
本当に必要なのは「QAという技術」だった!試行錯誤から生まれた、品質とデリバリーの両取りアプローチ / Turns Out, "QA as a Discipline" Was the Key!
ar_tama
6
960
勝手に!深堀り!Cloud Run worker pools / Deep dive Cloud Run worker pools
iselegant
4
640
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
227
22k
Agile that works and the tools we love
rasmusluckow
329
21k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
120
51k
Why Our Code Smells
bkeepers
PRO
336
57k
Code Reviewing Like a Champion
maltzj
523
40k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
14
1.4k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
32
5.5k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
780
Optimising Largest Contentful Paint
csswizardry
37
3.2k
Code Review Best Practice
trishagee
67
18k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.7k
Reflections from 52 weeks, 52 projects
jeffersonlam
349
20k
Transcript
私が知っておきたかった 統計手法 Kanazawa.rb meetup #93 Takayuki Takagi
Who am I? • Takayuki Takagi (高木貴之 / ニボシーニョ) •
@TAKAyuki_atkwsk / takayukiatkwsk • Freelance programmer • Working from home • Scala, Ruby, Python, AWS, Docker, etc. • Like beer and gyoza
今日の話 私が知っておきたかった統計手法を紹介します。 皆さんにとっては当たり前のことが多いかもしれません。 間違っていたら後で教えてください。
なぜ知っておきたかったのか • 数字やグラフを見ても意味が分からない ◦ Webサービスの監視 ◦ 調査レポート ◦ Covid-19 •
判断材料があるのにないことになってしまう ◦ それは困るので読めるようになりたい
分位数(quantile) • 定義 ◦ 「ある種の正の整数 m に対し、分布を m 等分する m-1
個の値、つまり、 i=1,...,m-1 に対する i/m 分位数を、m 分位数(ただし m は漢数字)とい う。」 ◦ https://ja.wikipedia.org/wiki/%E5%88%86%E4%BD%8D%E6%95%B0 • 中央値(第2四分位数、50パーセンタイル)、90パーセンタイ ル、95パーセンタイルはよく見る • ex.) レスポンスタイム
分位数: 降水量の例 金沢市の1月〜3月の降水量(ミリ/日) mean: 6.05 min: 0.00 median: 3.50 75
percentile: 8.75 90 percentile: 15.00 95 percentile: 18.25 max: 39.00 東京の1月〜3月の降水量(ミリ/日) mean: 2.49 min: 0.00 median: 0.00 75 percentile: 0.50 90 percentile: 6.00 95 percentile: 14.25 max: 55.50
移動平均(moving average) • 定義(単純移動平均) ◦ 「直近の n 個のデータの重み付けのない単純な平均である」 ◦ https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%
E5%9D%87 • データを平滑化する効果がある • 時系列データでよく使われる • ex.) Webサーバーへのリクエスト数、株価
移動平均: 最高気温の例 金沢市の最高気温(2020-04-04〜2020-05-04)
片対数グラフ(semi-log graph) • 定義 ◦ 「グラフの一方の軸が対数スケール(縦を対数スケールとすることが多い) になっているグラフである。極端に範囲の広いデータを扱える。」 ◦ https://ja.wikipedia.org/wiki/%E7%89%87%E5%AF%BE%E6%95%B0%E 3%82%B0%E3%83%A9%E3%83%95
• ex.) Covid-19の感染者数グラフ ◦ https://datausa.io/coronavirus
片対数グラフ: Covid-19の例 東京都と石川県のCovid-19累計感染者数(2020-01-24〜2020-05-09)
まとめ • 挙げたものについては、データの傾向が読み取れるように なった • 傾向が分かれば(将来的な)変化や異常値に気付ける ◦ 要因はこれだけでは分からないことを念頭に置く • Survive
していきましょう
参考資料 • 気象データ(CSV形式でダウンロード可) ◦ https://www.data.jma.go.jp/gmd/risk/obsdl/index.php • Covid-19感染者数データ ◦ https://raw.githubusercontent.com/tokyo-metropolitan-gov/covid19/ master/data/data.json
◦ https://raw.githubusercontent.com/prefishikawa/covid19/master/dat a/patients_summary.json