Upgrade to Pro — share decks privately, control downloads, hide ads and more …

監視論Ⅳ ~監視からオブザーバビリティーへの招待~

Qryuu
June 22, 2022

監視論Ⅳ ~監視からオブザーバビリティーへの招待~

Ops JAWS Meetup#21 で登壇した資料です。
ITシステムの進化史とそれに合わせて求められる運用とは
監視からオブザーバビリティーが求められるようになった背景を説明します。

Qryuu

June 22, 2022
Tweet

More Decks by Qryuu

Other Decks in Technology

Transcript

  1. 自己紹介 ▪ PN:九龍真乙 ▪ Twitter:qryuu ▪ SlideShre:https://www.slideshare.net/qryuu ▪ GitHub:https://github.com/qryuu ▪

    クックパッド:https://cookpad.com/kitchen/4142562 ▪ 専門:New Relic, Zabbix,カスタマーサポート,テクニカルサ ポート
  2. 汎用機の時代 ▪ 1960~70年代 ▪ メインフレーム、オフコンの時 代 ▪ 商社や金融など大規模な経理・ 事務・会計などで利用 ▪

    メーカー毎に差異があり、非常 に高額なため 「ハードを買うとオペレーター が付いてくる」 ▪ メーカーのオペレーターがビジ ネスロジックを把握しているた め狭義のベンダーロックイン (画像出典)総務省令和元年版 情報通信白書
  3. オープンシステムの時代 ▪ 1980~90年代 ▪ クライアント/サーバー方式 ▪ IAサーバ(PCサーバー)と 汎用OSによるシステム構築 ▪ マルチベンダー構成、内製

    化が可能に ▪ ITシステムの民主化 (画像出典) https://atmarkit.itmedia.co.jp/fsys/kaisetsu/043server_bto/server_bto.html
  4. 仮想化の時代 ▪ 2000年代 ▪ IAサーバの高性能化・低価 格化 ▪ システム規模に対して性能 過剰 ▪

    仮想化によって、サーバー リソースを無駄なく使う ▪ ITシステムの基盤化・抽象化 (画像出典) https://www.networld.co.jp/product/vmware/technical_guide/virtualization/
  5. システムはビジネスそのものになりつつある 11 1980年〜 2000年〜 2010年〜 メインフレーム・オープンシステム インターネット・WEB・ガラケー クラウド・スマートフォン・AI・IoT モード1:業務効率化 モード2:価値の提供

    業務効率化 自動化/情報分析 事業創造 メールやドキュメントなど インターネット検索やeコマース システム = ビジネス システム=ビジネス そのものになる時代へ
  6. 監視からオブザーバビリティへ ▪ オブザーバビリティではよ り多くの情報を収集し、何 が起こったのかを明らかに して根本原因に対処します 。 ▪ 障害ではなくて「いつもと 違う」を検知して対処しま

    す。 Metric 気温・気圧・湿 度・体温・血圧 CPU/メモリ使用 率・プロセス・ User満足度・応答 時間 Event 昨日19時から2時 まで飲みに行っ た リクエスト数・プ ログラム処理時間 (トランザクショ ン) Log 「今朝から頭が 痛い」 Errorlog、スタッ クトレース Trace 飲み屋でBさんと テキーラ10杯飲 んだ DB呼び出し、API 呼び出し 二日酔いですね、この頭痛薬と胃腸薬を飲みましょ う 深酒しちゃだめですよ、節制しましょう >原因の究明と、システムの改善
  7. ITモニタリングの変化 ペットモデル ▪ 小数のサーバーを管理 ▪ 大切なペットを守るよう に ▪ システムはステートフル ▪

    モノリシック キャトル(家畜)モデル ▪ 同じ機能の複数のサー バーによるクラスタ ▪ 家畜の群れのように管理 ▪ AutoScalingや AutoHealingの設定 ▪ アプリ/DBなどは分離さ れるがアーキテクチャは モノリシック オルガノ(臓器)モデル ▪ コンテナによるオーケス トレション ▪ 臓器のように個々のコン テナが増殖やアポトーシ ス(自死)を行う ▪ コンテナ1つ1つの監視で はなくシステムとしての 機能提供を確認する
  8. コンテナ時代に求められるオブザーバビリティ ▪ 外形監視・Synthetics による稼働確認 – 常に実際のユーザーと同じようにサービスにアクセスし、動作し続けてい る事を確認する。 ▪ RealUserMonitoring –

    モバイルやBrowserなど、サーバー以外の環境で実際のユーザにErrorが 発生していないか、性能が劣化していないかを確認する。 ▪ 開発品質Monitoring – デプロイ前後でのパフォーマンス比較や、デプロイ頻度など開発品質その もののモニタリング ▪ K8S管理、クラスター管理 – 単体コンテナでは無く、サービスとしてのSLI/SLOを把握する。