Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「Webエンジニアのための監視システム実装ガイド」発売!
Search
Toshiaki Baba
March 17, 2020
Technology
0
690
「Webエンジニアのための監視システム実装ガイド」発売!
#o11yjp Observability Japan Online #1 登壇資料
Toshiaki Baba
March 17, 2020
Tweet
Share
More Decks by Toshiaki Baba
See All by Toshiaki Baba
Forkewell Library 103 『バックエンドエンジニアのためのインフラ・クラウド大全』を通じたエンジニアとしての地力獲得活動のススメ
netmarkjp
8
3.2k
AI時代にも変わらぬ価値を発揮したい: インフラ・クラウドを切り口にユーザー価値と非機能要件に向き合ってエンジニアとしての地力を培う
netmarkjp
0
390
著者による『バックエンドエンジニアのためのインフラ・クラウド大全』120%活用術
netmarkjp
1
790
SREsのためのSRE定着ガイド
netmarkjp
12
9.2k
SREこのへんで苦戦しがちじゃないですか?
netmarkjp
13
6.8k
技術書を活用してほしい!
netmarkjp
0
590
しつこくじわじわパフォーマンスチューニング
netmarkjp
1
1.4k
現場がさき、 プラクティスがあと、 原則はだいじに
netmarkjp
4
3.3k
ばばさんは、なぜ本を書くの?という話
netmarkjp
0
1k
Other Decks in Technology
See All in Technology
知られざるprops命名の慣習 アクション編
uhyo
10
2.4k
Understanding Go GC #coefl_go_jp
bengo4com
0
1.1k
「守る」から「進化させる」セキュリティへ ~AWS re:Inforce 2025参加報告~ / AWS re:Inforce 2025 Participation Report
yuj1osm
1
110
RAID6 を楔形文字で組んで現代人を怖がらせましょう(実装編)
mimifuwa
0
300
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
30k
Evolution on AI Agent and Beyond - AGI への道のりと、シンギュラリティの3つのシナリオ
masayamoriofficial
0
170
7月のガバクラ利用料が高かったので調べてみた
techniczna
3
240
Oracle Base Database Service:サービス概要のご紹介
oracle4engineer
PRO
2
20k
認知戦の理解と、市民としての対抗策
hogehuga
0
310
自治体職員がガバクラの AWS 閉域ネットワークを理解するのにやって良かった個人検証環境
takeda_h
2
380
開発と脆弱性と脆弱性診断についての話
su3158
1
1.1k
人を動かすことについて考える
ichimichi
2
320
Featured
See All Featured
Product Roadmaps are Hard
iamctodd
PRO
54
11k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Designing Experiences People Love
moore
142
24k
Balancing Empowerment & Direction
lara
2
590
The Invisible Side of Design
smashingmag
301
51k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Bash Introduction
62gerente
614
210k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
31
2.2k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
8
480
Documentation Writing (for coders)
carmenintech
73
5k
Designing for Performance
lara
610
69k
Transcript
「Webエンジニアのための 監視システム実装ガイド」 発売! Observability Japan Online 2020-03-17
登場人物 2 @netmarkjp ばば としあき @ymotongpoo @katzchang Kazunori Otani
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコー ル...https://netmark.jp/2020/03/2020-03-03-21-21.html 3 https://amzn.to/330B1CQ
きっかけ 4 入門 監視 https://www.amazon.co.jp/dp/4873118646/ 2019/1/17発売 この本が全てのきっかけ 出版社:監視の本がアツいぞ… わたし:監視の本なら関わりたかった…
Webエンジニアのための監視システム実装ガイド 執筆経緯 2014-12-27 Webエンジニアが知っておきたいインフラの基本 発売 2019-02-08 ↑の編集さんから打診→本書の編集さんを紹介いただく 2019-02-08 企画書をいただく→目次案作成開始 2019-03-25
目次案fix(2019-04執筆開始⇒2019-09初旬脱稿予定) 2019-03-31 15時間でわかるMySQL実践入門 脱稿、本書を執筆開始 (2019-08に、2019-10初旬脱稿予定に変更) 2019-09-07 ISUCON予選⇒初日3位で久々に突破! 2019-10-05 ISUCON本選⇒11位... 2019-10-08 脱稿 2020-02-14 編集さんと初顔合わせ(基本メールだった) 2020-02-19 書名決定 2020-03-24 発売予定 5
ばばが本を書くときの気持ち • 自分の経験・知見をまとめて形にしたい ◦ 欲 • 毎度説明する代わりに「これ読んでください」したい ◦ Webエンジニアが知っておきたいインフラの基本はいまだに活躍しています •
自分の/エンジニアの常識・新常識を権威付けしたい ◦ 章を設けたりコラムを書いたりしました • 会社の宣伝をしたい ◦ 株式会社ハートビーツ https://heartbeats.jp/ MSP事業/開発事業やってます 6
Webエンジニアのための監視システム実装ガイド 概要1 Amazonのリード https://amzn.to/330B1CQ システムは、何もしないと壊れます。システムは、よくわからない状態になります。 どれだけ技術力の高いエンジニアが設計・構築しても、残念な事実として、システムを構築した後に何 もしないと壊れます、よくわからない状態になります。 システムを「監視」あるいは「モニタリング」することで、 ・異常を検知し復旧させること ・システムの価値を維持・向上させること
ができます。 本書では、監視テクノロジの動向から組織での実装まで、わかりやすく学ぶことができます。 最新ツールの説明、実装パターンの紹介だけでなく、組織での実装にあたっての態勢づくり、システム づくりについても現場目線で寄り添って解説しています。 これから監視を始める方にはもちろん、現状の監視システムに疑問を抱いている方にもおすすめの1冊で す。 7
Webエンジニアのための監視システム実装ガイド 概要2 8 監視(モニタリング)を -狭義:定期的・継続的に 、観測し異常を検知し復旧させること -広義:定期的・継続的に 、観測しシステムの価値を維持・向上させる営みの全て に分類し、まずは狭義→発展として広義を紹介しています。 監視システムの目的をチェック/メトリクスにわけて考え、それぞれの目的での
観測処理・観測結果収集・異常検知(判定)・通知などの流れや仕組みを解説し ています。 監視テクノロジ/運用の価値と限界、自己修復機構との役割分担について言及し ました。
もくじ 第1章 監視テクノロジの動向 1.1 システムにまつわる残念な事実 1.2 監視テクノロジの2つの志向性 1.3 監視テクノロジの動向 1.4
Webシステム運用の文化 第2章 監視テクノロジの概要 2.1 監視テクノロジで実現したいこと 2.2 可用性の測り方 2.3 監視システムの種類 2.4 監視システムの構成概要 2.5 自己修復機構と監視テクノロジ 2.6 自己修復システムの継続的運用を支える Chaos Engineering 第3章 監視テクノロジの基礎 3.1 監視テクノロジの基礎 3.2 観測部分の基礎技術 3.3 データ収集部分の基礎技術 3.4 データ利用部分の基礎技術 3.5 時系列データベースの基礎技術 3.6 ログの基礎技術 9 第4章 監視テクノロジの導⼊ 4.1 「監視」に対する期待 4.2 監視を始める 4.3 監視ツールどれにしよう問題 第5章 監視テクノロジの実装 5.1 アラーティングする / しないの基準 5.2 アラーティング目的の観測項目を決める 5.3 定番 の観測項目 第6章 インシデント対応実践編 6.1 インシデント対応の基礎知識 6.2 インシデント対応の心構え 6.3 インシデントが Open ステータスのときにやること 6.4 インシデントが Resolved ステータスのときにやること 6.5 恒久対応 / 改善対応 第7章 監視構成例 7.1 チェック、メトリクス、ログ、トレース、APMの構成 例 7.2 通知、 コミュニケーション、ドキュメント、チケット の構成例
小ネタ・コラム Pick up • Pets to Cattle ( ペットから家畜へ )
と Disposable ( 廃棄可能 ) ◦ インフラの常識の変化の話 • 時間ベースの可用性を採用するときに監視システム の実装から生じる制約 ◦ N分間隔のチェックだと変動の最小単位がN分だか ら%の測り方と目標値設定に注意 • 時間ベース ・ リクエストベースとその先の可用性 計算手法 ◦ Meaningful Availabilityの紹介 • 可用性指標の妥当性の検討 ◦ ユーザが喜ぶ/悲しむ指標はいい指標 • 自己修復機構を活かすための作り方の話 ◦ The Twelve-Factor Appの紹介 • 監視テクノロジで可用性は上がらない ! ◦ 下がりすぎないようにするもの • SLA は読み方が難しい ◦ 保証じゃなくて返金規準だし申請も難しい • MSP事業者の探し方 ◦ 宣伝 • 監視テクノロジを活用する我々はシステムのお医 者さんなのかもしれない ◦ 医療業界の「プライマリケア」の紹介 • コトにフォーカスして論理的にエンジニアリング しよう ◦ 直感や感情で対処してはならない ◦ トリプルチェックの実験結果の紹介 10
はじめに→ ディスカッションネタ帳 • 監視(モニタリング)にどっぷ りはまって/染まっていった理 由や経緯 • 監視/モニタリング関連のテク ノロジの魅力 •
監視/モニタリング関連の仕事 の魅力 11
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコール... 12 https://amzn.to/330B1CQ