Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Honeycomb で劇的改善デバッグ作業
Search
Tomonori Hayashi
January 23, 2025
1
4
Honeycomb で劇的改善デバッグ作業
2025.01.23 Findy Tools 感謝祭の 5 分枠で登壇させていただいた際の資料です。
https://findy-tools.connpass.com/event/339331/
Tomonori Hayashi
January 23, 2025
Tweet
Share
More Decks by Tomonori Hayashi
See All by Tomonori Hayashi
エラーバジェット枯渇の原因 - 偽陽性との戦い -
phaya72
1
85
Vertex AI Experimentsの実態 - コードを辿った先にあったもの -
phaya72
1
470
オブザーバビリティと開発優先度との向き合い方
phaya72
4
690
Cloud Service Mesh への期待が止まらない!!
phaya72
2
1k
とあるソフトウェアエンジニアの小さく始めるオブザーバビリティ
phaya72
2
330
OpenTelemetry Collector の Connectors って何者?
phaya72
2
1.6k
Cloud Service Mesh に触れ合う
phaya72
3
1.3k
Cloud Deploy と仲良くなりたい
phaya72
1
540
Cloud Run に日々感謝
phaya72
1
280
Featured
See All Featured
Being A Developer After 40
akosma
89
590k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
127
18k
Mobile First: as difficult as doing things right
swwweet
222
9k
Adopting Sorbet at Scale
ufuk
74
9.2k
Documentation Writing (for coders)
carmenintech
67
4.6k
Bash Introduction
62gerente
610
210k
Faster Mobile Websites
deanohume
305
30k
Designing for Performance
lara
604
68k
Six Lessons from altMBA
skipperchong
27
3.6k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.3k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
120k
Code Reviewing Like a Champion
maltzj
521
39k
Transcript
Honeycomb で劇的改善 デバッグ作業 Findy Tools 感謝祭 - Tomonori Hayashi 1
Tomonori Hayashi • NTT コミュニケーションズ ◦ ノーコード AI ツール「Node-AI」の開発/運用 ◦
ソフトウェアエンジニア ▪ Front:TypeScript - React/Next.js ▪ Infra:Google Cloud • Google Cloud Partner Top Engineer 2024 - 2025 • Google Cloud Partner Tech Blog Challenge 2024 個人カテゴリ 優秀ブログ • Google Cloud All Certifications • コミュニティ ◦ Google Cloud 公式ユーザーコミュニティ「 Jagu’e’r」 ▪ オブザーバビリティ分科会 運営 ▪ エバンジェリスト 2 @pHaya72 @t_hayashi
オブザーバビリティバックエンドとして Honeycomb を試験的に採用した話です “Honeycomb はすべてのテレメトリー信号を 1箇所に保存す ることで、本番環境で実際に何が起こっているかについての 唯一の信頼できる情報源を提供します。 ” 引用:https://www.honeycomb.io/platform
チームが直面している課題 サービスに異常が発生したことを 的確に検知することができない 過去の経験からアラートを仕掛けるが 発生する異常はアラートで検知できず発見が遅れる 異常が発見しても歴戦の戦士しか 発生箇所を見極められない 何かあればひたすらログを眺めるが 歴戦の戦士がいないと異常を発見しづらく対応が遅れる 検知や対応が遅れれば
ユーザーが満足に利用できない 事態を招く
Honeycomb の導入後のプロセスの変化 5 バーンレートアラートをきっかけにドリルダウンによる分析 • 導入前:人力での異常を発見 からログのみを漁って原因を分析 • 導入後:バーンレートアラートにより異常を自動検知 、原因分析にトレースやログを利用
→ これらが Honeycomb 上で完結する のが嬉しいポイント!
Honeycomb の導入後のプロセスの変化 6 バーンレートアラートをきっかけにドリルダウンによる分析 • 導入前:人力での異常を発見 からログのみを漁って原因を分析 • 導入後:バーンレートアラートにより異常を自動検知 、原因分析にトレースやログを利用
→ これらが Honeycomb 上で完結する のが嬉しいポイント! SLI/SLO を決めることで算出できるエラーバジェットの 消費速度が規定の数値を超えたらアラートで通知
Honeycomb の導入後のプロセスの変化 7 バーンレートアラートをきっかけにドリルダウンによる分析 • 導入前:人力での異常を発見 からログのみを漁って原因を分析 • 導入後:バーンレートアラートにより異常を自動検知 、原因分析にトレースやログを利用
→ これらが Honeycomb 上で完結する のが嬉しいポイント! 特に分析のプロセスが改善!! 数クリックで知りたい情報に辿り着ける
Honeycomb のココが良き!① 8 BubbleUp 機能により失敗イベントと成功イベントの間で違いを特定 /endpoint/path
Honeycomb のココが良き!① 9 BubbleUp 機能により失敗イベントと成功イベントの間で違いを特定 /endpoint/path 失敗イベントが発生しているエンドポイントを 瞬時に知ることができる
Honeycomb のココが良き!② 10 失敗イベントからトレースを特定しエラースパンに紐ずくログを確認 /endpoint/path
Honeycomb のココが良き!② 11 失敗イベントからトレースを特定しエラースパンに紐ずくログを確認 /endpoint/path 失敗イベントのスパンをすぐに検索できて スパンに紐づくログも右ウィンドウで確認できる
異常検知から原因特定までのスピードは劇的に短縮 • そもそも見過ごしていた異常が発見できるようになった • Honeycomb 上の数クリックで原因(もしくは近しい情報)を得られるようになった ログの紐付けが一部未対応であったり、文化の醸成も • スパンにログが紐づいていないとスパン ID
をもとに別ツールから検索する必要がある • 特定の開発者のみしかツールを扱えず、チームとして文化になるまでは道半ば まとめ
CREDITS: This presentation template was created by Slidesgo, and includes
icons by Flaticon, and infographics & images by Freepik Thanks! 13 @pHaya72 @t_hayashi