Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
o11yツールを乗り換えた話
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
tak0x00
August 08, 2025
Technology
3.1k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
o11yツールを乗り換えた話
tak0x00
August 08, 2025
More Decks by tak0x00
See All by tak0x00
CDNのログでLPの可観測性を高めた話
tak0x00
1
210
Other Decks in Technology
See All in Technology
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
270
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
410
生成 AI 実践ガイド (概略版) AIガバナンス編
asei
0
100
2026TECHFRESH畢業分享會 - AI 時代的人生存檔點
line_developers_tw
PRO
0
1.3k
アジャイルな経理と Claude Code と経営の未来
kawaguti
PRO
3
150
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
1.3k
Bucharest Tech Week 2026 - Guardians of the Cloud-Native Galaxy
edeandrea
PRO
0
120
IaC コードを資産へ:AWS CDK 社内ライブラリと横断展開 / aws-summit-japan-2026
gotok365
2
740
AIチャット検索改善の3週間
kworkdev
PRO
2
130
2026 TECHFRESH 畢業分享會 - 開發日常大解密!從領域驅動到企業級上線
line_developers_tw
PRO
0
1.2k
ぼっちではじめた登壇が「51名」「241件」の発信に化けた
subroh0508
0
170
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
1.2k
Featured
See All Featured
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
440
Rails Girls Zürich Keynote
gr2m
96
14k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
370
Design in an AI World
tapps
1
250
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
160
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
250
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.3k
What does AI have to do with Human Rights?
axbom
PRO
1
2.2k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
230
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
Transcript
o11yツールを乗り換えた話 福本隆弘 (tak_0x00 )
自己紹介 名前: 福本 隆弘 Twitter (X): @tak_0x00 (趣味垢) 所属: 某リユース事業の会社の
SRE
今日の話は? o11yツールを乗り換えた話 - 何を目的として乗り換えたのか - 乗り換えするときに認識すべき事項 - 乗り換え作業前後のあれやこれや どちらが良い悪いという話ではなく、選択のポイントと移行準備の話です!
対象となったシステム - AWS/EC2で動作するLAMPで構成されたシステム - APサーバ(PHP環境)は10-100台で変動 - Datadogを用いたo11y環境を構築
どうして移行するに至ったのか - コスト - 全台モニタリングする環境を整えようとしたら費用がすごかった - EC2の台数変動が10~50台と幅広く、予算ブレがすごい - APMが導入できない -
詳細なパフォーマンス分析のために APMを導入したかった - 環境がそれなりに古かったため、 php moduleがインストールできない - 半年以上格闘したが、どうにか入れても seg faultで落ちる...
どうして移行するに至ったのか - コスト - 全台モニタリングする環境を整えようとしたら費用がすごかった →NewRelicならアカウント数依存 (ダッシュボード閲覧なら Free Userで可) -
APMが導入できない - 詳細なパフォーマンス分析のために APMを導入したかった →NewRelic APMを試験導入したところ問題なく動作した
どうして移行するに至ったのか - コスト - 全台モニタリングする環境を整えようとしたら費用がすごかった →NewRelicならアカウント数依存 (ダッシュボード閲覧なら Free Userで可) -
APMが導入できない - 詳細なパフォーマンス分析のために APMを導入したかった →NewRelic APMを試験導入したところ問題なく動作した Full Platformが必要なはずの APMもダッシュボード化すると閲 覧できた(当時) 元々OTELやdd-agentが導入され ておらず、完全新規導入なため 任意の選択を行いやすい状態
移行戦略を考える 試用期間 併用/切り替え準備 完全切り替え
移行戦略を考える -試用期間 試用期間 併用/切り替え準備 完全切り替え - SRE側作業 - 一部のサーバをAutoScalingグループから外し、手動で NewRelic環境を設定
- APMや各種メトリクス送信のチェック - 環境変更に伴う負荷増加やクラッシュが無いかチェック - エンジニア向けNewRelicダッシュボードの作成
移行戦略を考える -併用期間 試用期間 併用/切り替え準備 完全切り替え - SRE側作業 - NewRelic/Datadog両方をセットアップした EC2イメージに切り替え
- NewRelicのデータ使用量が想定通りかチェック - エンジニア側作業 - NewRelicの使用感確認・Datadogとの差についてSREにフィードバック
移行戦略を考える -切替完了へ向けて 併用・切り替え準備 試用期間 完全切り替え - SRE側作業 - NewRelicのみをセットアップした EC2イメージに切り替え
- エンジニア側作業 - 各種振り返り資料などの Datadogダッシュボードのキャプチャ取得 - 各ドキュメントのリンク修正
移行戦略のポイント - Datadogと同じ構成のダッシュボード を作成し、提供 - 「せっかく覚えた見方、また覚え直し?」の低減 - 単プロダクトだったため、ダッシュボード自体の枚数が少なかったことも大きい - 並行期間を充分に設ける(今回は3ヶ月ほど)
- 丸め誤差による表現の差など、 DatadogとNewRelicの差を実感・認識 してもらう - Datadog時代のキャプチャの取得 ・確保
移行してどうでした? - 予算 - (同条件だと)以前より安価に。安心して使えるようになった - 契約容量を超過する利用をしても、 2~3ヶ月以内に容量削減するか再契約するかを選択できる - o11y環境として
- APM/RUM導入により実環境でのパフォーマンスチェックが可能となった - サンプリングではなく、全台のモニタリングが可能となった - やや使い勝手は悪くなった - グラフ表現の多様性が低い - Full Platform/Basic Userの切り替えが面倒 - (当時)日中帯に破壊的UI変更があることが多く安定しない - (慣れるまで)NRQLがとっかかりづらい
移行してどうでした? - 予算 - (同条件だと)以前より安価に。安心して使えるようになった - 契約容量を超過する利用をしても、 2~3ヶ月以内に容量削減するか再契約するかを選択できる - o11y環境として
- APM/RUM導入により実環境でのパフォーマンスチェックが可能となった - サンプリングではなく、全台のモニタリングが可能となった - やや使い勝手は悪くなった - グラフ表現の多様性が低い - Full Platform/Basic Userの切り替えが面倒 - (当時)日中帯に破壊的UI変更があることが多く安定しない - (慣れるまで)NRQLがとっかかりづらい とはいえ、 見れないツールより見れるツール
まとめ -o11yツールを乗り換えてみたよ - - 課金体系・サポート対象のフレームワークなどに不満があり乗り換えた - 移行に際していくつかの施策を実施し、スムーズな移行をサポート - 並行期間を充分に設ける -
同じ体験を得られるダッシュボードの作成 - 各チームでやることの指示 - 無事に移行し、目的を達することができた
まとめ -o11yツールを乗り換えようとする時に考えること - 各プロダクトの相対評価を実施する - 課金体系の違い - ダッシュボード・グラフ表現の差 - 得意とするIaaSやサポートしているメトリクス・フレームワークの差
- (個人的には)NewRelicはAWSに、DataDogはGCPに強い印象 - 数ヶ月程度の並行期間を設ける - 実際の使用感をSRE以外でも確かめる - 旧ツールでの指標データの確保 を実施する - 新旧両方のツールで同時間の指標を取得し、 読み替えができる ようにする