Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Zabbix から Mackerel へ #mackerelio / zabbix-to-ma...
Search
Manabu Sakai
October 17, 2016
Technology
10
28k
Zabbix から Mackerel へ #mackerelio / zabbix-to-mackerel
Mackerel Meetup #8 Tokyo の発表スライドです。
Manabu Sakai
October 17, 2016
Tweet
Share
More Decks by Manabu Sakai
See All by Manabu Sakai
アウトプットが切り拓いた自分のエンジニア人生 / Infra Study 2nd #8
manabusakai
0
29k
GitHub Actions の self-hosted runner と Amazon EKS を使った Docker のビルドパイプライン / secure-docker-build-pipeline
manabusakai
0
2.1k
SaaS における EKS のシングルテナントクラスタ戦略とスポットインスタンス活用術 / EKS single-tenant cluster strategy and Spot Instances
manabusakai
0
7.3k
freee のエンジニアは障害から何を学び、どう改善しているのか? / What do freee engineers learn and improve from failures?
manabusakai
8
20k
我々は Kubernetes の何を監視すればいいのか? / CloudNative Days Kansai 2019
manabusakai
25
8.7k
CI/CD パイプラインを最速で組み立てるための 4 つのポイント / Four points to assemble the CI CD pipeline fastest
manabusakai
9
3.8k
Kubernetes を使ってエンジニア組織の生産性を上げよう / kubernetes-and-engineer-productivity
manabusakai
3
7.4k
freee のマイクロサービスを K8s + Go で組む! 短期プロジェクト成功の記録 / microservices-using-k8s-and-go
manabusakai
4
10k
Kubernetes 入門者が 3 か月で本番導入するためにやったこと / kubernetes-beginner
manabusakai
7
14k
Other Decks in Technology
See All in Technology
OPENLOGI Company Profile for engineer
hr01
1
38k
Bet "Bet AI" - Accelerating Our AI Journey #BetAIDay
layerx
PRO
4
1.8k
Claude CodeでKiroの仕様駆動開発を実現させるには...
gotalab555
3
1.1k
AIのグローバルトレンド 2025 / ai global trend 2025
kyonmm
PRO
1
140
生成AIによるソフトウェア開発の収束地点 - Hack Fes 2025
vaaaaanquish
32
14k
20250807_Kiroと私の反省会
riz3f7
0
230
Jamf Connect ZTNAとMDMで実現! 金融ベンチャーにおける「デバイストラスト」実例と軌跡 / Kyash Device Trust
rela1470
1
200
ロールが細分化された組織でSREと協働するインフラエンジニアは何をするか? / SRE Lounge #18
kossykinto
0
220
バクラクによるコーポレート業務の自動運転 #BetAIDay
layerx
PRO
1
950
MCP認可の現在地と自律型エージェント対応に向けた課題 / MCP Authorization Today and Challenges to Support Autonomous Agents
yokawasa
5
2.4k
【CEDEC2025】『Shadowverse: Worlds Beyond』二度目のDCG開発でゲームをリデザインする~遊びやすさと競技性の両立~
cygames
PRO
1
370
Claude Codeは仕様駆動の夢を見ない
gotalab555
23
6.6k
Featured
See All Featured
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.5k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
36
2.5k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
Balancing Empowerment & Direction
lara
1
540
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Rails Girls Zürich Keynote
gr2m
95
14k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
The Invisible Side of Design
smashingmag
301
51k
Gamification - CAS2011
davidbonilla
81
5.4k
Practical Orchestrator
shlominoach
190
11k
Producing Creativity
orderedlist
PRO
347
40k
Transcript
Zabbix から Mackerel へ Mackerel で実現したコストダウン Mackerel Meetup #8 Tokyo
本日のハッシュタグ #mackerelio
今日お話しすること • Zabbix から Mackerel へ移行した経緯 • Mackerel の導入で得られたメリット 最後の
5 分で質疑応答を受け付けます。
スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう
freee のご紹介 スモールビジネスの バックオフィス業務を “圧倒的に効率化” するサービスを提供。
freee が提供するサービス • 会計 freee • 給与計算 freee • 会社設立
freee • マイナンバー管理 freee • 開業 freee 10/10 release!
自己紹介 Twitter / GitHub @manabusakai
自己紹介 • 2016 年 5 月 freee に入社 • 開発者よりのインフラエンジニア
◦ Scala, Ruby での開発や AWS が得意分野
None
None
会場の皆さまに質問です
会場アンケート 当てはまる方は挙手をお願いします。 • インフラエンジニアの方 • 監視ツールに Zabbix を使っている方 • Zabbix
に不満を持っている方 • 監視ツールにワクワクしている方
None
移行スケジュール • 7 月上旬:検証開始 • 7 月下旬:本契約 • 10 月:移行完了
2 〜 3 か月あれば充分移行できます
なぜ Zabbix から 移行したのか?
Zabbix で起きていた 3 つの問題点 1. Zabbix 自体の運用コストが高い 2. クラウドの監視に向いていない 3.
開発者が活用できていない
① Zabbix 自体の運用コストが高い Zabbix を安定運用させるには手間がかかる。 • MySQL チューニング • IOPS
チューニング (RAID, LVM, etc) • Housekeeper の負荷との戦い • 監視項目の追加が面倒くさい • Zabbix サーバのバージョンアップ Zabbix おじさん…
② クラウドの監視に向いていない • Auto Scaling を導入したことで、個々ではなく全体の傾向を見 る必要が出てきた ◦ Zabbix で全体の傾向を見るのは工夫が必要
• VPC 毎に Zabbix サーバを立てる必要がある
③ 開発者が活用できていない • UI が使いにくいため、一部の開発者にしか利用されていな かった • 監視ツールはインフラチームだけが見ればいいもの?
【参考】他の監視ツールも検討 コスト 移行 運用 使いやすさ Zabbix 3.0 ◯ ◎ △
× Sensu ◯ × △ △ Prometheus ◯ × × △ Mackerel △ ◎ ◎ ◎
Mackerel に移行して どうだったか?
① 全体の傾向を把握できるように • Mackerel のロール機能を活用 ◦ 役割単位で全体の傾向が把握できるようになった 台数が増減しても 全体の傾向がわかる
【実例】メモリリークを早期に検知 とあるロールでメモリリークが発生。全体の傾向が見ただけでパッ と掴めた。 デプロイ直後から 傾向が急変してる
【ワンポイント】 EC2 タグを活用 AWS CLI を使って EC2 タグを取得し、サービスとロールを mackerel-agent の起動オプションに追加。
mackerel-agent -role=<service>:<role> EC2 タグから取得。 起動すれば自動的に ロールに追加される!
② AWS のコストダウンを実現 • ロールごとに適正な台数が把握できた • Auto Scaling で台数を調整しコストダウンを実現 ◦
約 5 〜 10% 削減 • Mackerel のコストは充分ペイした
【ワンポイント】 Slack 通知を活用 working になっていないホストや AWS のコストを Slack に通知 し、手間なく情報を得られるようにした。
③ 進化し続ける監視ツール • Mackerel は毎週アップデートされる監視ツール • Webhook や REST API、mkr
コマンドなど 一般的な Web 技術を使って簡単にハックできる
ウソじゃない!
まとめ Mackerel を導入したことで、 • 監視ツールを運用するという人的コストがゼロに • 適切なサーバ台数を知ることで無駄を省きコストダウンにつな がった ※ 導入してからまだ日が浅いので、開発者が活用するようになったかは次の機会にご紹介します。
うまい話ばかりだと 胡散くさいので…
改善してもらいたい点 1. グラフの描画が重い ◦ 動的に読み込むのでどうしても時間がかかる 2. AWS インテグレーションの充実 ◦ 対応しているのは
EC2, ELB, RDS, ElastiCache ◦ Redshift や SQS もお願いします!
エンジニア募集中! 「freee 採用」で検索!
スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう