Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Zabbix から Mackerel へ #mackerelio / zabbix-to-ma...
Search
Manabu Sakai
October 17, 2016
Technology
10
27k
Zabbix から Mackerel へ #mackerelio / zabbix-to-mackerel
Mackerel Meetup #8 Tokyo の発表スライドです。
Manabu Sakai
October 17, 2016
Tweet
Share
More Decks by Manabu Sakai
See All by Manabu Sakai
アウトプットが切り拓いた自分のエンジニア人生 / Infra Study 2nd #8
manabusakai
0
25k
GitHub Actions の self-hosted runner と Amazon EKS を使った Docker のビルドパイプライン / secure-docker-build-pipeline
manabusakai
0
2k
SaaS における EKS のシングルテナントクラスタ戦略とスポットインスタンス活用術 / EKS single-tenant cluster strategy and Spot Instances
manabusakai
0
6.9k
freee のエンジニアは障害から何を学び、どう改善しているのか? / What do freee engineers learn and improve from failures?
manabusakai
8
19k
我々は Kubernetes の何を監視すればいいのか? / CloudNative Days Kansai 2019
manabusakai
24
8.5k
CI/CD パイプラインを最速で組み立てるための 4 つのポイント / Four points to assemble the CI CD pipeline fastest
manabusakai
9
3.7k
Kubernetes を使ってエンジニア組織の生産性を上げよう / kubernetes-and-engineer-productivity
manabusakai
3
7.2k
freee のマイクロサービスを K8s + Go で組む! 短期プロジェクト成功の記録 / microservices-using-k8s-and-go
manabusakai
4
10k
Kubernetes 入門者が 3 か月で本番導入するためにやったこと / kubernetes-beginner
manabusakai
7
14k
Other Decks in Technology
See All in Technology
【Startup CTO of the Year 2024 / Audience Award】アセンド取締役CTO 丹羽健
niwatakeru
0
1.3k
DynamoDB でスロットリングが発生したとき_大盛りver/when_throttling_occurs_in_dynamodb_long
emiki
1
430
アジャイルチームがらしさを発揮するための目標づくり / Making the goal and enabling the team
kakehashi
3
140
Lambda10周年!Lambdaは何をもたらしたか
smt7174
2
110
障害対応指揮の意思決定と情報共有における価値観 / Waroom Meetup #2
arthur1
5
480
【令和最新版】AWS Direct Connectと愉快なGWたちのおさらい
minorun365
PRO
5
760
第1回 国土交通省 データコンペ参加者向け勉強会③- Snowflake x estie編 -
estie
0
130
【Pycon mini 東海 2024】Google Colaboratoryで試すVLM
kazuhitotakahashi
2
540
生成AIが変えるデータ分析の全体像
ishikawa_satoru
0
170
AWS Lambda のトラブルシュートをしていて思うこと
kazzpapa3
2
180
インフラとバックエンドとフロントエンドをくまなく調べて遅いアプリを早くした件
tubone24
1
430
SRE×AIOpsを始めよう!GuardDutyによるお手軽脅威検出
amixedcolor
0
170
Featured
See All Featured
Embracing the Ebb and Flow
colly
84
4.5k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
RailsConf 2023
tenderlove
29
900
Producing Creativity
orderedlist
PRO
341
39k
Designing the Hi-DPI Web
ddemaree
280
34k
Optimizing for Happiness
mojombo
376
70k
Imperfection Machines: The Place of Print at Facebook
scottboms
265
13k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
26
2.1k
The Cult of Friendly URLs
andyhume
78
6k
Raft: Consensus for Rubyists
vanstee
136
6.6k
Automating Front-end Workflow
addyosmani
1366
200k
4 Signs Your Business is Dying
shpigford
180
21k
Transcript
Zabbix から Mackerel へ Mackerel で実現したコストダウン Mackerel Meetup #8 Tokyo
本日のハッシュタグ #mackerelio
今日お話しすること • Zabbix から Mackerel へ移行した経緯 • Mackerel の導入で得られたメリット 最後の
5 分で質疑応答を受け付けます。
スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう
freee のご紹介 スモールビジネスの バックオフィス業務を “圧倒的に効率化” するサービスを提供。
freee が提供するサービス • 会計 freee • 給与計算 freee • 会社設立
freee • マイナンバー管理 freee • 開業 freee 10/10 release!
自己紹介 Twitter / GitHub @manabusakai
自己紹介 • 2016 年 5 月 freee に入社 • 開発者よりのインフラエンジニア
◦ Scala, Ruby での開発や AWS が得意分野
None
None
会場の皆さまに質問です
会場アンケート 当てはまる方は挙手をお願いします。 • インフラエンジニアの方 • 監視ツールに Zabbix を使っている方 • Zabbix
に不満を持っている方 • 監視ツールにワクワクしている方
None
移行スケジュール • 7 月上旬:検証開始 • 7 月下旬:本契約 • 10 月:移行完了
2 〜 3 か月あれば充分移行できます
なぜ Zabbix から 移行したのか?
Zabbix で起きていた 3 つの問題点 1. Zabbix 自体の運用コストが高い 2. クラウドの監視に向いていない 3.
開発者が活用できていない
① Zabbix 自体の運用コストが高い Zabbix を安定運用させるには手間がかかる。 • MySQL チューニング • IOPS
チューニング (RAID, LVM, etc) • Housekeeper の負荷との戦い • 監視項目の追加が面倒くさい • Zabbix サーバのバージョンアップ Zabbix おじさん…
② クラウドの監視に向いていない • Auto Scaling を導入したことで、個々ではなく全体の傾向を見 る必要が出てきた ◦ Zabbix で全体の傾向を見るのは工夫が必要
• VPC 毎に Zabbix サーバを立てる必要がある
③ 開発者が活用できていない • UI が使いにくいため、一部の開発者にしか利用されていな かった • 監視ツールはインフラチームだけが見ればいいもの?
【参考】他の監視ツールも検討 コスト 移行 運用 使いやすさ Zabbix 3.0 ◯ ◎ △
× Sensu ◯ × △ △ Prometheus ◯ × × △ Mackerel △ ◎ ◎ ◎
Mackerel に移行して どうだったか?
① 全体の傾向を把握できるように • Mackerel のロール機能を活用 ◦ 役割単位で全体の傾向が把握できるようになった 台数が増減しても 全体の傾向がわかる
【実例】メモリリークを早期に検知 とあるロールでメモリリークが発生。全体の傾向が見ただけでパッ と掴めた。 デプロイ直後から 傾向が急変してる
【ワンポイント】 EC2 タグを活用 AWS CLI を使って EC2 タグを取得し、サービスとロールを mackerel-agent の起動オプションに追加。
mackerel-agent -role=<service>:<role> EC2 タグから取得。 起動すれば自動的に ロールに追加される!
② AWS のコストダウンを実現 • ロールごとに適正な台数が把握できた • Auto Scaling で台数を調整しコストダウンを実現 ◦
約 5 〜 10% 削減 • Mackerel のコストは充分ペイした
【ワンポイント】 Slack 通知を活用 working になっていないホストや AWS のコストを Slack に通知 し、手間なく情報を得られるようにした。
③ 進化し続ける監視ツール • Mackerel は毎週アップデートされる監視ツール • Webhook や REST API、mkr
コマンドなど 一般的な Web 技術を使って簡単にハックできる
ウソじゃない!
まとめ Mackerel を導入したことで、 • 監視ツールを運用するという人的コストがゼロに • 適切なサーバ台数を知ることで無駄を省きコストダウンにつな がった ※ 導入してからまだ日が浅いので、開発者が活用するようになったかは次の機会にご紹介します。
うまい話ばかりだと 胡散くさいので…
改善してもらいたい点 1. グラフの描画が重い ◦ 動的に読み込むのでどうしても時間がかかる 2. AWS インテグレーションの充実 ◦ 対応しているのは
EC2, ELB, RDS, ElastiCache ◦ Redshift や SQS もお願いします!
エンジニア募集中! 「freee 採用」で検索!
スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう