Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
KubeCon___CNCon_でみた最近のPrometheus.pdf
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
yosshi_
December 27, 2018
Technology
230
1
Share
KubeCon___CNCon_でみた最近のPrometheus.pdf
yosshi_
December 27, 2018
More Decks by yosshi_
See All by yosshi_
Getting Started with Kubernetes Observability
yosshi_
8
2.7k
PromQL_Compatibility_Testing_Recap
yosshi_
0
1.1k
プロダクト誕生の背景から学ぶ PrometheusとGrafana Loki
yosshi_
11
3.8k
これから学ぶKubernetesのReconciliation Loop
yosshi_
15
5k
伝統的なエンプラ企業で取り組むインフラの設計書のモダナイゼーション.pdf
yosshi_
13
6.3k
KubeCon2019_NA_Recap__NATS_.pdf
yosshi_
0
210
“Running Apache Samza on Kubernetes” Recap : KubeCon2019@NA
yosshi_
3
1.3k
Kuberntes_Monitoring_入門.pdf
yosshi_
17
3.2k
Kubernetes_Logging入門.pdf
yosshi_
18
7.9k
Other Decks in Technology
See All in Technology
AI時代のガードレールとしてのAPIガバナンス
nagix
0
300
はじめての MagicPod生成AI機能 機能紹介から活用方法まで
magicpod
0
110
「責任あるAIエージェント」こそ自社で開発しよう!
minorun365
9
2.2k
実践ハーネスエンジニアリング:TAKTで実現するAIエージェント制御 / Practical Harness Engineering: AI Agent Control Enabled by TAKT
nrslib
12
4.8k
Microsoft 365 / Microsoft 365 Copilot : 自分の状態を確認する「ラベル」について
taichinakamura
0
350
AI駆動1on1〜AIに自分を育ててもらう〜
yoshiakiyasuda
0
150
ServiceNow Knowledge 26 の歩き方
manarobot
0
150
Pure Intonation on Browser: Building a Sequencer with Ruby
nagachika
0
150
[OpsJAWS 40]リリースしたら終わり、じゃなかった。セキュリティ空白期間をAWS Security Agentで埋める
sh_fk2
3
250
AIを共同作業者にして書籍を執筆する方法 / How to Write a Book with AI as a Co-Creator
ama_ch
2
150
Standards et agents IA : un tour d’horizon de MCP, A2A, ADK et plus encore
glaforge
0
190
Rapid Start: Faster Internet Connections, with Ruby's Help
kazuho
2
770
Featured
See All Featured
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Building an army of robots
kneath
306
46k
Thoughts on Productivity
jonyablonski
76
5.1k
RailsConf 2023
tenderlove
30
1.4k
Technical Leadership for Architectural Decision Making
baasie
3
330
Embracing the Ebb and Flow
colly
88
5k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
220
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
720
Reality Check: Gamification 10 Years Later
codingconduct
0
2.1k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Context Engineering - Making Every Token Count
addyosmani
9
840
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Transcript
ç KubeCon + CNCon でみた 最近のPrometheus KubeCon+CNCon NA 2018 Recap!!@Cybozu
@yosshi_
⾃⼰紹介 n 吉村 翔太(@yosshi_) n NTTコミュニケーションズ所属 n データサイエンスチーム n インフラエンジニア/データエンジニアリング
n Kurbernetes、Kafka etc n コミュニティ活動 “Cloud Native Developers JP”
What is Prometheus? 参考< https://prometheus.io/docs/introduction/overview/ > Googleで使⽤していた監視ツール「Borgmon」を参考にしたらしい 所感:メトリクスを取り扱うのが得意
Architecture 参考< https://prometheus.io/docs/introduction/overview/ >
Kubeconの参加前に気になってたこと n 可⽤性/拡張性 n 冗⻑化構成 n 監視対象が増加した際の性能の維持 n ログの⻑期保管
Prometheusだけで出来そうなこと - 信頼性 n SPOFを無くしたい LB Act-Act LBでヘルスチェック Prometheus Grafana
Target 2個作ってもいいよね
Prometheusだけで出来そうなこと - 拡張性 n監視対象が増えても通知のレスポンスは落としたくない Prometheus 1 Grafana 1 Target 1
2系統作ればいいじゃないか Target 2 Prometheus 2 Grafana 2
Prometheusだけで出来そうなこと - ⻑期保管 n キャパシティプランニング⽤に欲しい 外部ストレージに書き出せば 参考< https://prometheus.io/docs/prometheus/latest/storage/#remote-storage-integrations >
Prometheusだけで出来そうなこと - ⻑期保管 多段にしても何とかなるか? Target Grafana 監視⽤ Prometheus ⻑期保管⽤ (保管期間1年)
Grafana ⻑期保管⽤ Prometheus 監視⽤ (保管期間14⽇) 特定のメトリクスだけ収集
Kubeconでの収穫 n Cortex - Infinitely Scalable Prometheus n URL(https://sched.co/GrXL) n
Adopting Prometheus the Hard Way n URL(https://sched.co/GrXX) n Large Scale Automated Storage with Kubernetes n URL(https://sched.co/Gsxn) n Intro: Prometheus nURL(https://sched.co/GrXX)
Friends of Prometheus Thanos/Cortex/M3 参考< https://kccna18.sched.com/event/GrXX>
Prometheusで最初に⽬指した世界 参考< https://improbable.io/games/blog/thanos-prometheus-at-scale > n Target毎にPrometheusを配置 n フェデーレションを使って、横断してみれるPrometheus ダメでした 構成は複雑だし
遅くなる
What is Thanos 参考< https://improbable.io/games/blog/thanos-prometheus-at-scale > n Sidecarを使って、複数のPrometheusを1個⾒せてるふう VitessとMySQLの 関係に似てるな
Thanosの分散処理 n Querierが神様になって処理を分散してくれる よく⾒る “神”&”Sidecar”パターンですね 既存のプロダクトを“神”&”Sidecar”でスケールするのってKube界に多いですね。
Thanosの⻑期保管 n SidecarさんがS3 or GCSに書いてくれる
What is Cortex ? LogoのURL < https://github.com/cortexproject/cortex > n CNCF
sandbox project n 特徴 n Horizontally scalable n Highly Available n Long-term storage n Multi-tenant 参考< https://sched.co/GrXL>
Architecture 参考< https://github.com/cortexproject/cortex/blob/master/docs/architecture.md> Prometheusの Remote write API Prometheusそのものを スケールさせようとはしていない 書き出し先の外部ストレージに
Queryの実⾏エンジンが付いてるふう
What is M3 参考< https://github.com/m3db/m3> nUberが開発 n分散型の時系列DB
参考< https://sched.co/Gsxn> UberでのM3の利⽤状況
参考< https://sched.co/Gsxn> UberでのM3の利⽤状況
Architecture 参考< https://eng.uber.com/m3/ > これもPrometheusのSidecar
Architecture 参考< https://eng.uber.com/m3/ > n etcdに書いてあるルールに応じて集計、圧縮して書き込んでくれる
【参考】盛り上がったKeynote Julia Evans(Stripe) Melanie Cebula(Airbnb) Matt Schallert(Uber) Celina Ward(Uber) 2⽇⽬朝(https://sched.co/GsxY)
1⽇⽬夜(https://sched.co/GsxA) 3⽇⽬朝(https://sched.co/Gsxn) 1⽇⽬朝(https://www.cncf.io/phippy/) Phippy(Simple PHP app) & Fiends
【参考】Phippy & Friendsの画像の⼊⼿先 参考< https://github.com/cncf/artwork/tree/master/other/phippy-and-friends >