Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Backlog の運用監視 / Operational Monitoring of Backlog

Backlog の運用監視 / Operational Monitoring of Backlog

2017年10月30日(月)に行われたGeeks Who Drink in福岡 モニタリング勉強会edition でヌーラボの松浦が発表した、「Backlogの運用監視」の資料です。

株式会社ヌーラボ

October 30, 2017
Tweet

More Decks by 株式会社ヌーラボ

Other Decks in Technology

Transcript

  1. Backlog の運用監視 松浦 祐亮 ‒ Nulab Inc. Geeks Who Drink

    in Fukuoka モニタリング勉強会 Edition
  2. 自己紹介 ‒ Yusuke Matsuura @matsuzj ‒ Nulab Inc. ‒ Site

    Reliability Engineer @Backlog ‒ 趣味は登山・キャンプ ‒ Job ‒ Web サービスの開発/運用を始めて11年ぐらい経ちます ‒ アプリケーションエンジニアからインフラ方面へ ‒ 現在は運用・改善・トラブルシュート等 ‒ Team ‒ 2015年7月から Nulab のインフラ担当としてジョイン ‒ 2016年9月から SRE チームを2名で発足 ‒ 2017年8月から SREメンバーが追加されて3名体制へ
  3. 改善内容 ‒ 開発 ・UI変更 ・Nulab Apps 連携(認証機能強化) ・クレジットカード決済対応 ・Jenkins にてCI/CDを実施しており

    だいたい2週間に一回はアプリケーシ ョンがデプロイされています ・機能単位で Play / Scala へ移行中
  4. 改善内容 ‒ 運用 ・Infrastructure as Code の実施 (Terraform, Ansible, Serverspec,

    awspec) ・運用環境をより安定性の高いものへ 移行(EC2, ALB , RDS for Aurora, ElasticCash, VPC) ・ミドルウェアの改善・開発(Proxy サーバ設置, Git SSH サーバの更新、 画像配信方法の変更)
  5. 監視概要 仮想マシン ( AWS 提供 ) 外部ホスト OS ミドルウェア アプリケーション

    Cloudwatch mackerel サービス ( Backlog ) nagios Serverspec awspec Fluentd
  6. Serverspec サーバの構成をテスト ・変更点がレポジトリに push された場合に Jenkins に てテストを実施 ・日に3回 Jenkins

    によるテストを実施 ・ミドルウェアやアプリケーションの設定値が正しいか ・ディスクのマウント先が正しいか ・必要なデーモンが起動しているか ・サーバプロビジョニングが正しく行われたか ・Serverspec が通ってから Mackerel を起動します
  7. 監視内容を改善するタイミング Topic for Nagios Topic for CI/CD Topic for Mackerel

    サーバの状況が変わるアクションは 随時Typetalkで監視し検知する ようにしている 日々の運用監視の兆候をチェッ クし状況に応じて、サーバを操 作したり、監視項目を追加して いる Nulaber Topic for DEV Nulabers ‑ SRE/DEV