Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
freee を支えるインフラ技術 / freee-infrastructure
Search
Manabu Sakai
January 19, 2017
Technology
7
16k
freee を支えるインフラ技術 / freee-infrastructure
【freee × プレイド】Tech Meetup 〜インフラ監視編〜
Manabu Sakai
January 19, 2017
Tweet
Share
More Decks by Manabu Sakai
See All by Manabu Sakai
アウトプットが切り拓いた自分のエンジニア人生 / Infra Study 2nd #8
manabusakai
0
28k
GitHub Actions の self-hosted runner と Amazon EKS を使った Docker のビルドパイプライン / secure-docker-build-pipeline
manabusakai
0
2.1k
SaaS における EKS のシングルテナントクラスタ戦略とスポットインスタンス活用術 / EKS single-tenant cluster strategy and Spot Instances
manabusakai
0
7.3k
freee のエンジニアは障害から何を学び、どう改善しているのか? / What do freee engineers learn and improve from failures?
manabusakai
8
20k
我々は Kubernetes の何を監視すればいいのか? / CloudNative Days Kansai 2019
manabusakai
25
8.7k
CI/CD パイプラインを最速で組み立てるための 4 つのポイント / Four points to assemble the CI CD pipeline fastest
manabusakai
9
3.8k
Kubernetes を使ってエンジニア組織の生産性を上げよう / kubernetes-and-engineer-productivity
manabusakai
3
7.4k
freee のマイクロサービスを K8s + Go で組む! 短期プロジェクト成功の記録 / microservices-using-k8s-and-go
manabusakai
4
10k
Kubernetes 入門者が 3 か月で本番導入するためにやったこと / kubernetes-beginner
manabusakai
7
14k
Other Decks in Technology
See All in Technology
Flutter向けPDFビューア、pdfrxのpdfium WASM対応について
espresso3389
0
130
関数型プログラミングで 「脳がバグる」を乗り越える
manabeai
1
190
Beyond Kaniko: Navigating Unprivileged Container Image Creation
f30
0
130
開発生産性を測る前にやるべきこと - 組織改善の実践 / Before Measuring Dev Productivity
kaonavi
9
4.1k
Lufthansa ®️ USA Contact Numbers: Complete 2025 Support Guide
lufthanahelpsupport
0
190
Claude Code に プロジェクト管理やらせたみた
unson
6
3.9k
ゼロからはじめる採用広報
yutadayo
3
910
Delta airlines®️ USA Contact Numbers: Complete 2025 Support Guide
airtravelguide
0
340
NewSQLや分散データベースを支えるRaftの仕組み - 仕組みを理解して知る得意不得意
hacomono
PRO
2
130
第4回Snowflake 金融ユーザー会 Snowflake summit recap
tamaoki
1
280
IPA&AWSダブル全冠が明かす、人生を変えた勉強法のすべて
iwamot
PRO
2
110
成長し続けるアプリのためのテストと設計の関係、そして意思決定の記録。
sansantech
PRO
0
120
Featured
See All Featured
Bash Introduction
62gerente
613
210k
We Have a Design System, Now What?
morganepeng
53
7.7k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.7k
Rails Girls Zürich Keynote
gr2m
95
14k
Embracing the Ebb and Flow
colly
86
4.7k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Optimising Largest Contentful Paint
csswizardry
37
3.3k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
Thoughts on Productivity
jonyablonski
69
4.7k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
181
54k
Transcript
を支えるインフラ監視 【freee × プレイド】Tech Meetup
#plaidtech
話すこと • freee で使っている監視系サービス • 少人数で運用するためのノウハウ
話さないこと • 監視の基本的なこと • 各監視サービスの比較や使い方
自己紹介 Twitter / GitHub @manabusakai
自己紹介 • 坂井 学(さかい まなぶ) • 2016 年にインフラエンジニアとして入社 • Scala
/ Ruby / PHP を書いてました • 得意分野は AWS ◦ AWS 認定ソリューションアーキテクト - プロフェッショナル ◦ AWS 認定 DevOps エンジニア - プロフェッショナル
スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう
freee が提供するサービス • 会計 freee • 給与計算 freee • 会社設立
freee • マイナンバー管理 freee • 開業 freee
freee が提供するサービス
freee で使っている 監視系サービス
• サーバー監視 ◦ Mackerel <https://mackerel.io/> ◦ CloudWatch <https://aws.amazon.com/cloudwatch/> ◦ Prometheus
<https://prometheus.io/> • パフォーマンス監視 ◦ New Relic <https://newrelic.com/> ◦ MONyog <https://www.webyog.com/> • トラッキング ◦ Redash <https://redash.io/> ◦ Kibana <https://www.elastic.co/products/kibana/>
それぞれの守備範囲 AWS サーバ アプリ データベース Mackerel ◯ ◯ ◯ CloudWatch
◯ Prometheus ◯ New Relic ◯ MONyog ◯
インフラエンジニアは 何人いますか?
3 / 80 人
None
1 人あたり 20 万事業所
効率化しないと回らない!
少人数で運用するために 工夫していること
① 情報はプルよりプッシュ 必要な情報は一か所にプッシュされる仕組みを作る。 • Slack に通知しているもの ◦ Mackerel からのアラート ◦
GitHub など外部サービスの障害情報 ◦ アプリケーションのパフォーマンスサマリー ◦ AWS のコスト ◦ Qiita:Team の新着記事
① 情報はプルよりプッシュ
② フルマネージドサービスの活用 AWS のフルマネージドサービスを活用して、 監視するポイントを根本から減らす。 • トレードオフとの兼ね合い ◦ 運用が楽になる ⇔
ブラックボックスが増える ◦ ノーメンテナンス ⇔ 障害が起きたら手が出せない ◦ 設定が簡単 ⇔ 痒いところに手が届かない
③ 障害が起きることを前提に 障害が起きることを前提にインフラを設計する。 • 例えば ◦ サーバは Auto Scaling で管理し可用性を担保する
◦ 単一障害点を作り出さない ◦ リトライを前提としたコードを書く ◦ etc...
③ 障害が起きることを前提に “障害を避ける最もよい方法は、 常に障害を起こすことである”
④ 本業にフォーカスする サービスをより良くすることにフォーカスする。 それ以外の部分はお金で解決するのもアリ。 • Zabbix から Mackerel へ移行 ◦
結果的には Mackerel のコストは充分ペイした ◦ Mackerel Meetup #8 Tokyo (2016/10/17) で発表 ▪ ref. Zabbix から Mackerel へ - Mackerel で実現したコストダウン
④ 本業にフォーカスする
⑤ トラッキングして見える化 数値をトラッキングして見える化する。 • 数値は嘘をつかない ◦ 曖昧さを排除できる ◦ 数値を元に改善サイクルを回す
⑤ トラッキングして見える化 様々なメトリクスをトラッ キングして、見える化
まとめ
まとめ freee はごく普通の監視サービスを使っていますが、 工夫することで少人数を実現しています。 1. 情報はプルよりプッシュ 2. フルマネージドサービスの活用 3. 障害が起きることを前提に
4. 本業にフォーカスする 5. トラッキングして見える化
エンジニア募集中
最後に宣伝 今年から個人事業主として開業しました。 • AWS の導入支援 • AWS アーキテクチャのコンサルティング などをやっています。 興味を持った方は、気軽にお声がけください