Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Backlog の運用監視 / Operational Monitoring of Backlog

Backlog の運用監視 / Operational Monitoring of Backlog

2017年10月30日(月)に行われたGeeks Who Drink in福岡 モニタリング勉強会edition でヌーラボの松浦が発表した、「Backlogの運用監視」の資料です。

Avatar for 株式会社ヌーラボ

株式会社ヌーラボ

October 30, 2017
Tweet

More Decks by 株式会社ヌーラボ

Other Decks in Technology

Transcript

  1. Backlog の運用監視 松浦 祐亮 ‒ Nulab Inc. Geeks Who Drink

    in Fukuoka モニタリング勉強会 Edition
  2. 自己紹介 ‒ Yusuke Matsuura @matsuzj ‒ Nulab Inc. ‒ Site

    Reliability Engineer @Backlog ‒ 趣味は登山・キャンプ ‒ Job ‒ Web サービスの開発/運用を始めて11年ぐらい経ちます ‒ アプリケーションエンジニアからインフラ方面へ ‒ 現在は運用・改善・トラブルシュート等 ‒ Team ‒ 2015年7月から Nulab のインフラ担当としてジョイン ‒ 2016年9月から SRE チームを2名で発足 ‒ 2017年8月から SREメンバーが追加されて3名体制へ
  3. 改善内容 ‒ 開発 ・UI変更 ・Nulab Apps 連携(認証機能強化) ・クレジットカード決済対応 ・Jenkins にてCI/CDを実施しており

    だいたい2週間に一回はアプリケーシ ョンがデプロイされています ・機能単位で Play / Scala へ移行中
  4. 改善内容 ‒ 運用 ・Infrastructure as Code の実施 (Terraform, Ansible, Serverspec,

    awspec) ・運用環境をより安定性の高いものへ 移行(EC2, ALB , RDS for Aurora, ElasticCash, VPC) ・ミドルウェアの改善・開発(Proxy サーバ設置, Git SSH サーバの更新、 画像配信方法の変更)
  5. 監視概要 仮想マシン ( AWS 提供 ) 外部ホスト OS ミドルウェア アプリケーション

    Cloudwatch mackerel サービス ( Backlog ) nagios Serverspec awspec Fluentd
  6. Serverspec サーバの構成をテスト ・変更点がレポジトリに push された場合に Jenkins に てテストを実施 ・日に3回 Jenkins

    によるテストを実施 ・ミドルウェアやアプリケーションの設定値が正しいか ・ディスクのマウント先が正しいか ・必要なデーモンが起動しているか ・サーバプロビジョニングが正しく行われたか ・Serverspec が通ってから Mackerel を起動します
  7. 監視内容を改善するタイミング Topic for Nagios Topic for CI/CD Topic for Mackerel

    サーバの状況が変わるアクションは 随時Typetalkで監視し検知する ようにしている 日々の運用監視の兆候をチェッ クし状況に応じて、サーバを操 作したり、監視項目を追加して いる Nulaber Topic for DEV Nulabers ‑ SRE/DEV