Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
私が知っておきたかった統計手法 / Statistical methods I wanted...
Search
TAKAyukiatkwsk
May 16, 2020
Technology
0
240
私が知っておきたかった統計手法 / Statistical methods I wanted to know
Kanazawa.rb meetup #93 で発表した資料です。
TAKAyukiatkwsk
May 16, 2020
Tweet
Share
More Decks by TAKAyukiatkwsk
See All by TAKAyukiatkwsk
argo-rolloutsにコミットした話
takayukiatkwsk
0
30
EnvoyのWasm filterを体験する
takayukiatkwsk
0
44
自分用趣味アプリを作っている話
takayukiatkwsk
0
94
zoxideのご紹介
takayukiatkwsk
0
90
Kanazawa.rbに参加してからのふりかえり
takayukiatkwsk
0
46
git-secretsとgitフックをざっと理解する
takayukiatkwsk
0
330
計測プラットフォームSREチームとシステム障害対応 / measurement platform SRE team's incident response
takayukiatkwsk
0
1.1k
Flutterに入門して体重グラフアプリを作る / Get started Flutter and build a weight graph app
takayukiatkwsk
0
410
リモートワークを振り返る / Look back on remote-working
takayukiatkwsk
0
120
Other Decks in Technology
See All in Technology
ビジネス職が分析も担う事業部制組織でのデータ活用の仕組みづくり / Enabling Data Analytics in Business-Led Divisional Organizations
zaimy
1
290
AWS CDKの仕組み / how-aws-cdk-works
gotok365
10
750
20250708オープンエンドな探索と知識発見
sakana_ai
PRO
3
610
2025-07-06 QGIS初級ハンズオン「はじめてのQGIS」
kou_kita
0
180
事例で学ぶ!B2B SaaSにおけるSREの実践例/SRE for B2B SaaS: A Real-World Case Study
bitkey
1
280
[SRE NEXT] ARR150億円_エンジニア140名_27チーム_17プロダクトから始めるSLO.pdf
satos
3
1.7k
CDK Toolkit Libraryにおけるテストの考え方
smt7174
1
370
60以上のプロダクトを持つ組織における開発者体験向上への取り組み - チームAPIとBackstageで構築する組織の可視化基盤 - / sre next 2025 Efforts to Improve Developer Experience in an Organization with Over 60 Products
vtryo
2
630
TLSから見るSREの未来
atpons
2
200
データ基盤からデータベースまで?広がるユースケースのDatabricksについて教えるよ!
akuwano
3
160
Rethinking Incident Response: Context-Aware AI in Practice
rrreeeyyy
1
230
第4回Snowflake 金融ユーザー会 Snowflake summit recap
tamaoki
1
330
Featured
See All Featured
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
970
KATA
mclloyd
30
14k
StorybookのUI Testing Handbookを読んだ
zakiyama
30
5.9k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
50
5.5k
Designing for Performance
lara
610
69k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
The Cost Of JavaScript in 2023
addyosmani
51
8.5k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
5.9k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
Embracing the Ebb and Flow
colly
86
4.7k
Transcript
私が知っておきたかった 統計手法 Kanazawa.rb meetup #93 Takayuki Takagi
Who am I? • Takayuki Takagi (高木貴之 / ニボシーニョ) •
@TAKAyuki_atkwsk / takayukiatkwsk • Freelance programmer • Working from home • Scala, Ruby, Python, AWS, Docker, etc. • Like beer and gyoza
今日の話 私が知っておきたかった統計手法を紹介します。 皆さんにとっては当たり前のことが多いかもしれません。 間違っていたら後で教えてください。
なぜ知っておきたかったのか • 数字やグラフを見ても意味が分からない ◦ Webサービスの監視 ◦ 調査レポート ◦ Covid-19 •
判断材料があるのにないことになってしまう ◦ それは困るので読めるようになりたい
分位数(quantile) • 定義 ◦ 「ある種の正の整数 m に対し、分布を m 等分する m-1
個の値、つまり、 i=1,...,m-1 に対する i/m 分位数を、m 分位数(ただし m は漢数字)とい う。」 ◦ https://ja.wikipedia.org/wiki/%E5%88%86%E4%BD%8D%E6%95%B0 • 中央値(第2四分位数、50パーセンタイル)、90パーセンタイ ル、95パーセンタイルはよく見る • ex.) レスポンスタイム
分位数: 降水量の例 金沢市の1月〜3月の降水量(ミリ/日) mean: 6.05 min: 0.00 median: 3.50 75
percentile: 8.75 90 percentile: 15.00 95 percentile: 18.25 max: 39.00 東京の1月〜3月の降水量(ミリ/日) mean: 2.49 min: 0.00 median: 0.00 75 percentile: 0.50 90 percentile: 6.00 95 percentile: 14.25 max: 55.50
移動平均(moving average) • 定義(単純移動平均) ◦ 「直近の n 個のデータの重み付けのない単純な平均である」 ◦ https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%
E5%9D%87 • データを平滑化する効果がある • 時系列データでよく使われる • ex.) Webサーバーへのリクエスト数、株価
移動平均: 最高気温の例 金沢市の最高気温(2020-04-04〜2020-05-04)
片対数グラフ(semi-log graph) • 定義 ◦ 「グラフの一方の軸が対数スケール(縦を対数スケールとすることが多い) になっているグラフである。極端に範囲の広いデータを扱える。」 ◦ https://ja.wikipedia.org/wiki/%E7%89%87%E5%AF%BE%E6%95%B0%E 3%82%B0%E3%83%A9%E3%83%95
• ex.) Covid-19の感染者数グラフ ◦ https://datausa.io/coronavirus
片対数グラフ: Covid-19の例 東京都と石川県のCovid-19累計感染者数(2020-01-24〜2020-05-09)
まとめ • 挙げたものについては、データの傾向が読み取れるように なった • 傾向が分かれば(将来的な)変化や異常値に気付ける ◦ 要因はこれだけでは分からないことを念頭に置く • Survive
していきましょう
参考資料 • 気象データ(CSV形式でダウンロード可) ◦ https://www.data.jma.go.jp/gmd/risk/obsdl/index.php • Covid-19感染者数データ ◦ https://raw.githubusercontent.com/tokyo-metropolitan-gov/covid19/ master/data/data.json
◦ https://raw.githubusercontent.com/prefishikawa/covid19/master/dat a/patients_summary.json