Upgrade to Pro — share decks privately, control downloads, hide ads and more …

弊社監視サービスの基盤にMackerelを採用してみた

Seigo Watanabe
October 23, 2019
2.5k

 弊社監視サービスの基盤にMackerelを採用してみた

Mackerel Drink Up #9 Tokyo LT#2
https://mackerelio.connpass.com/event/144889/

Seigo Watanabe

October 23, 2019
Tweet

More Decks by Seigo Watanabe

Transcript

  1. About me 渡辺聖剛 • クラスメソッド株式会社 AWS 事業本部 オペレーション部 この10月より パートナーアライアンス部

    • 前職までは所謂インフラエンジニア • 最初に触ったモニタリングシステム ◦ MRTG, OpenView/NNM • 好きな AWS サービス ◦ ACM, Route 53 AWS Systems Manager • 運用/分析/モニタリング SaaS https://dev.classmethod.jp/author/watanabe-seigo/ 2
  2. 6 旧(既存)監視サービスの問題点 - オンプレミスであることの問題 - EC2などの管理 - 機能拡張 - AWS新サービスへの対応

    - コンテナ、サーバーレスへの対応 - (弊社内で)レガシーである問題 - 内製サブシステムの老朽化・メンテナの確保 - Ruby, Java - 現在のクラメソ社員のもつスキルとの乖離 - 「今のクラメソがオススメするAWS監視サービス」 とは何なのか問題
  3. 7 最低要件 - SaaSであること - きっと勝手にバージョンアップ・機能追加してくれる - インフラの運用・管理の手間がかからないハズ - 既存のサービスメニューを踏襲できること

    - 全面的な乗り換えを視野に - EC2監視やURL外形監視、AWSインフラ監視など - 拡張性やメンテナンス性 - サービス展開のしやすさ - サポート・パートナー展開 - 国内市場を重視してくれるか - 直販以外の販売ルートがあるか それって    では?
  4. 8 なぜ Mackerel を選んだか - SaaSである - オンプレのシステムは極力管理したくない - AWS連携・機能拡張あり

    - mackerel-agent plugin、Webhook - 外形(or Synthetic)監視も標準で備える - 選考対象だった別SaaS  では不可だった(’18/4当時) - 純国内企業製 - 国内市場を熟知・優先しているハズ - あの「株式会社はてな」と仕事が出来る ← - その他(見た目の分かりやすさ等)
  5. 10 はじめてから1年ほど経ちました - 社内で Mackerel 使いが増えました - モニタリング分野に興味を持つ社員が複数 JOIN -

    旧システムは未だに動いています(涙 - Mackerel の進化に追いついていない - やっぱり完全ノー運用とはいかない - 空前の「入門『監視』」ブーム - CloudWatch も地味に進化 - 監視/分析 SaaS の日本市場進出著しい - 犬とか遺跡とか
  6. 11 今後やりたいこと - Mackerel の新機能をサービスにとりこむ - AWSインテグレーションの provisioning 自動化 -

    APIが公開されていないので… |ω・`) - Mackerel を便利につかうノウハウ記事(ブログ) をふやす - 他プロダクトとの住み分けの啓蒙 - Mackerel ≠ 銀の弾丸 - もちろん他のプロダクトも同様 - 不適材不適所だとだれも幸せにならない
  7. 12 夢 - MackerelでIdP(AD連携など)使いたいよなぁ - mackerel-agent の config は外部参照(パラメータ ストアや

    S3 とか)したいなぁ - AWSリソース の Name タグが display_name に入る ようにならないかなぁ - AWSインテグレーションで、カスタムメトリックも 取りたかったりするんだよなぁ - 外部ソース(AWS APIやPrometheus Exporter 等) に対応するとかっこいいな!
  8. - いっそのこと Amazon EventBridge に対応してくれ ないかなぁ… - AWSインテグレーションの設定APIはいつ解放される んだろう -

    URL外形監視レスポンスタイムで異常値検知したい - RDSのイベント(Failover等)を通知させたいなぁ - WindowsホストでCPU利用率の天井が99.8%とかに なる問題 - APIキー毎の利用実績とか見られたらうれしいなぁ 13 夢(cont.)
  9. 14 宣伝 https://dev.classmethod.jp/news/developers-io-2019-tokyo/ Developers.IO 2019 TOKYO 11/1 (Fri.) ベルサール東京日本橋 -

    8トラック60+セッション - 懇親会、技術相談会あり - 記事内に割引クーポンあります
  10. 15