Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
家族アルバム みてねにおけるGrafana活用術 / Grafana Meetup Japan...
Search
Isao Shimizu
April 24, 2024
Technology
2
1.9k
家族アルバム みてねにおけるGrafana活用術 / Grafana Meetup Japan Vol.1 LT
2024.4.24
Grafana Meetup Japan #1 LT
Isao Shimizu
April 24, 2024
Tweet
Share
More Decks by Isao Shimizu
See All by Isao Shimizu
Notion x ポストモーテムで広げる組織の学び / Notion x Postmortem
isaoshimizu
1
330
New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
isaoshimizu
3
1.1k
「家族アルバム みてね」における運用管理・ オブザーバビリティの全貌 / Overview of Operation Management and Observability in FamilyAlbum
isaoshimizu
5
3.4k
約10年間MIXIのインフラを 支えてきたPagerDutyの活用事例 / PagerDuty on Tour 2024
isaoshimizu
6
1.3k
家族アルバム みてねで直面してきた技術的負債 / MIXI KAG 2024
isaoshimizu
18
9.1k
今年1年のEKS運用振り返り/3-shake SRE Tech Talk
isaoshimizu
2
430
ポストモーテムの基礎知識と最新事例 / Fundamentals of Postmortem
isaoshimizu
12
3.3k
全世界1,800万人が利用する「家族アルバム みてね」におけるNew Relic活用法 / FutureStack Tokyo 2023
isaoshimizu
1
620
『家族アルバム みてね』で計測しているSLIの事例 / SLI as measured in FamilyAlbum
isaoshimizu
4
820
Other Decks in Technology
See All in Technology
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
43k
マイグレーションガイドに書いてないRiverpod 3移行話
taiju59
0
270
Amazon Bedrock AgentCoreでブラウザ拡張型AI調査エージェントを開発した話 (シングルエージェント編)
nasuvitz
2
120
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
4k
チームメンバー迷わないIaC設計
hayama17
1
390
AIで 浮いた時間で 何をする? 2026春 #devsumi
konifar
16
3.3k
もう怖くないバックグラウンド処理 Background Tasks のすべて - Hakodate.swift #1
kantacky
0
120
Bill One 開発エンジニア 紹介資料
sansan33
PRO
5
18k
2026-02-25 Tokyo dbt meetup プロダクトと融合したCI/CD で実現する、堅牢なデータパイプラインの作り方
y_ken
0
140
「使いにくい」も「運用疲れ」も卒業する UIデザイナーとエンジニアが創る持続可能な内製開発
nrinetcom
PRO
0
430
LINEアプリ開発のための Claude Code活用基盤の構築
lycorptech_jp
PRO
1
1k
Claude Codeはレガシー移行でどこまで使えるのか?
ak2ie
0
1k
Featured
See All Featured
30 Presentation Tips
portentint
PRO
1
240
Deep Space Network (abreviated)
tonyrice
0
78
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
59
50k
How to train your dragon (web standard)
notwaldorf
97
6.5k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.4k
The Spectacular Lies of Maps
axbom
PRO
1
570
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
1
130
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Building an army of robots
kneath
306
46k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
130
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
Transcript
©MIXI ©MIXI 家族アルバム みてねにおける Grafana活用術 Grafana Meetup Japan #1 LT
Vantageスタジオ みてねプロダクト開発部 プラットフォームグループ 清水 勲
2 ©MIXI About me 週末は社会人吹奏楽団での活動(楽団長、トロンボーン約30年、たまに指揮者) キャンプとクラフトビールが好き New Relic User Group
運営 清水 勲 @isaoshimizu 家族アルバム みてね Engineering Manager(SRE/CRE/セキュリティ) SIer時代(受託・自社開発) SNS「mixi」 モンスター ストライクなど みてね 2003年 2011年 2014年 2018年 2024年 新卒入社 ミクシィ(現MIXI)入社 C/C++/C#/PHP/Python/iOS/AWS Fedora/MySQL/LXC /OpenStack Linux/MySQL/Ruby AWS/MySQL/Ruby 2022年1月〜EM
©MIXI 家族アルバム みてね
©MIXI 家族アルバム みてねはスマホで撮った子どもの写真や動画を家族と共有し、 コミュニケーションして楽しむ家族アルバムサービスです。
©MIXI 家族アルバム みてねでは 直近6年くらい Grafana が大活躍しています!
©MIXI 家族アルバム みてねにおける オブザーバビリティの変遷
7 ©MIXI 家族アルバム みてねにおけるオブザーバビリティの変遷 Amazon CloudWatch コンソール サービスリリース SREチーム設立 New
Relic APM Grafana New Relic Infrastructure 現在 Prometheus 2015年 2018年 2024年 EKS移行 完了 2021年 以降はGrafanaのデータソースとしての利用が多い New Relic Mobile
8 ©MIXI 家族アルバム みてねにおけるオブザーバビリティの全体像 Amazon EKS Kubernetes Prometheus New Relic
Rails New Relic Ruby agent Grafana Node Exporter Amazon CloudWatch Amazon Managed Service for Prometheus Grafana Loki Promtail ユーザーの端末上 のアプリ New Relic Mobile モニタリング環境 Fluent Bit Amazon Data Firehose Amazon S3 Amazon Athena GCS BigQuery ETL処理 データの流れ Amazon Aurora Amazon RDS Performance Insights
©MIXI なぜ Grafana?
10 ©MIXI なぜ Grafana? 圧倒的な使い勝手の良さ • 画面遷移、操作が軽い、グラフ描画が速い • グラフが美しい、種類が豊富 •
マネジメントコンソールの認証を通らなくて良い(別の認証を使える) • 様々なデータソースを扱える(CloudWatch以外にもGoogle、Prometheus、Loki、Tempoなど) • Persistent URL / Shortened URL での共有が楽(Slackでのコミュニケーションなど) • アップデートが簡単(Helm Chartのバージョン上げるだけ。マイグレーション簡単) • SSO対応(アカウント棚卸し簡単) • オートリフレッシュ • アノテーション(グラフにコメントできる) • Explore機能(Prometheusのクエリをサクッと試すとか)
©MIXI Grafana 活用シーン
12 ©MIXI Grafana 活用シーン • 毎日の朝会でダッシュボードをチーム全員で眺める(SREチーム、Data Engineeringチームなど) ◦ 各グラフのトレンドの変化を見る ▪
例:AWSコスト、LBリクエスト数とエラー数、Aurora/DynamoDB/ElastiCacheの負荷、 SES/SNSの送信数とエラー数、ジョブキューの滞留状態、ノード数、Pod数、OOMKilled等 • アラート発報時 ◦ New Relicも併用しつつ、Grafanaのダッシュボードを見て、アラート内容から関連箇所のグラフ を確認する • ログ確認 ◦ Lokiを介して開発環境、本番環境のログを見る • 施策ごとのダッシュボード ◦ 規模の大きめな施策時に個別のダッシュボードを作り、施策に関わるメトリクスをモニタリングで きるように
©MIXI Grafana のおかげで 数々の問題を解決してきました
©MIXI Grafana 大好きです!
©MIXI