Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サービスパフォーマンス改善セッション ( Datadog Event 2026/02/10 )
Search
bell033
February 13, 2026
Technology
0
12
サービスパフォーマンス改善セッション ( Datadog Event 2026/02/10 )
bell033
February 13, 2026
Tweet
Share
More Decks by bell033
See All by bell033
7,000万ユーザーの信頼を守る「TimeTree」のオブザーバビリティ実践 ( Datadog Live Tokyo )
bell033
1
160
Other Decks in Technology
See All in Technology
PostgreSQL 18のNOT ENFORCEDな制約とDEFERRABLEの関係
yahonda
0
140
OCI技術資料 : ロード・バランサ 概要 - FLB・NLB共通
ocise
4
27k
VSCode中心だった自分がターミナル沼に入門した話
sanogemaru
0
810
ADK + Gemini Enterprise で 外部 API 連携エージェント作るなら OAuth の仕組みを理解しておこう
kaz1437
0
220
QA組織のAI戦略とAIテスト設計システムAITASの実践
sansantech
PRO
1
220
CloudFrontのHost Header転送設定でパケットの中身はどう変わるのか?
nagisa53
1
220
BFCacheを活用して無限スクロールのUX を改善した話
apple_yagi
0
130
Embeddings : Symfony AI en pratique
lyrixx
0
380
AIエージェント勉強会第3回 エージェンティックAIの時代がやってきた
ymiya55
0
150
SSoT(Single Source of Truth)で「壊して再生」する設計
kawauso
2
390
CREがSLOを握ると 何が変わるのか
nekomaho
0
160
Sansanの認証基盤を支えるアーキテクチャとその振り返り
sansantech
PRO
1
110
Featured
See All Featured
Navigating Weather and Climate Data
rabernat
0
150
SEO for Brand Visibility & Recognition
aleyda
0
4.4k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
440
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
340
Scaling GitHub
holman
464
140k
Docker and Python
trallard
47
3.8k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.4k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
150
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
150
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Skip the Path - Find Your Career Trail
mkilby
1
89
Transcript
サービスパフォーマンス改善セッション — 改善サイクルとチーム横断での意思決定をどう実装するのか — 01 TimeTree 2026/02/10(Tue.) Datadog Event
02 TimeTree 本名 : 小笹 彰太 ( Shota Ozasa )
ニックネーム : Bell ⾃⼰紹介 株式会社 TimeTree 技術本部 SREチーム エンジニア 趣味: お酒の飲み比べ、アニメ鑑賞
03 TimeTree Agenda 1. TimeTree の SRE 2. TimeTree の
定点観測 3. TimeTree の 改善サイクル 4. まとめ
1 TimeTree と SRE 04 TimeTree
05 TimeTree TimeTree とは? 予定の「共有」「可視化」と そこで生まれる「コミュニケーション」 によって、予定管理を誰にとっても 当たり前で簡単なものにします。 数あるサービスの中で、 パーソナル
× 共有を軸に 価値提供しているプロダクトです。 05
06 TimeTree 新しくつくられた予定、変更された予定は、 TimeTreeがあなたに代わって相手に素早くお知らせ します。 大切な予定を忘れることも、言った言わないのすれ ちがいも起きません。 TimeTree TimeTree 共有カレンダー
TimeTreeを使ってだれでも気軽にイベント情報を発 信することもできます。 見逃してほしくない大事な予定情報を発信するオ フィシャルサイトが簡単につくれます。 公開カレンダー
07 TimeTree Google Cloud ・Cloud Run ・Cloud Spanner ・Memorystore AWS
・Lambda ・CloudFront ・S3 技術スタック ( ⼀部抜粋 ) Ruby on Rails バックエンドアプリケーション GitHub Actions CI / CD インフラ構成 Terraform IaC
08 TimeTree Observability の構成 ( 概略図 ) Run ( BE
Service ) Run ( AI Service ) Engineer APM Dashboard Google Cloud App Container DD Agent App Container DD Agent Spanner CDN Integration Slack Alert
09 TimeTree チーム体制 共有カレンダー事業部 iOS, Android, Web, Backend 公開カレンダー事業部 iOS,
Android, Web, Backend ・各事業部に SRE 担当が Join ・定点観測会も 事業部 / チーム ごとで開催 SRE チーム ※ この他にも Ads / Data 事業部 などもあります Join Join
2 TimeTree の定点観測 010 TimeTree
011 TimeTree 共有カレンダー事業部 iOS, Android, Web, Backend 公開カレンダー事業部 iOS, Android,
Web, Backend ・各事業部に SRE 担当が Join ・定点観測会も 事業部 / チーム ごとで開催 SRE チーム ※ この他にも Ads / Data 事業部 などもあります Join Join 週1で実施 週1で実施 2軸の定点観測と参加者
012 TimeTree SRE チーム内での定点観測 Push 通知施策の 負荷の結果は... 共有カレンダー 担当 SRE
公開カレンダー 担当 SRE 参考にします。 Ads 担当 SRE Data 担当 SRE etc... このエラーについては... 例 : Dashboard を⾒ながら 各事業部の施策や 過去の対応などの 情報を交換できる 個々の SRE だけでは 気づきにくいような、 SRE 全員で⾒た時の 気づきを、お互いに 共有できる
013 TimeTree 事業部チーム内 ( SRE × BE ) での定点観測 xx
のレイテンシーが良く なっていますが... 共有カレンダー 担当 SRE 共有カレンダー 担当 BE ライブラリのアップデート がありました。 他メンバー 来週 xx 機能がリリース 予定なので... 例 : Dashboard を⾒ながら 今週のリリース内容の 解像度⾼め、 その影響を追いやすく なる 来週のリリース内容の 解像度⾼め、 状況に応じてインフラ の備えがしやすくなる
014 TimeTree SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫 インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット )
015 TimeTree コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット ) インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫
016 TimeTree コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット ) インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫
3 TimeTree の改善サイクル 017 TimeTree
018 TimeTree 改善タスクの検知パターンの例 (1) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 SRE チームによる
メトリクス確認 & 各チームへの 確認・共有 修正・改善タスク
019 TimeTree 改善タスクの検知パターンの例 (2) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 Zendesk SNS
( X など )
020 TimeTree 改善タスクの検知パターンの例 (3) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 Sentry Cloud
Monitoring Alert Datadog Monitor Slack
021 TimeTree 改善タスクの両⽴ 改善タスク 施策に基づく開発タスク 2割 8割 スクラム開発 1 スプリントの内訳
スクラム開発を採⽤している 事業部によっては、スプリントの中で⼀定割合を 改善タスクにリソースを充てている
4 まとめ 022 TimeTree
023 TimeTree 定点観測の運⽤ • SRE 内だけでなく、 事業部 ( BE ×
SRE ) でも定点観測を毎週 実施する • これにより、チーム間 の温度差や情報ギャッ プが減る まとめ 改善の判断基準 • コード改修後は、API レイテンシーやスロー クエリ、リクエスト数 など、TimeTree の サービス特性的には 先週比で見ることも大 切 改善タスクの両⽴ • 改善タスクが発生する キッカケは様々で、 日常的に発生する • 仕組みとしてスクラム開 発の中に、改善タスクの ためのリソース 2 割を 意識的に確保することが 大切
024 TimeTree サンプリングの塩梅 Bits AI の活⽤ ここ最近の課題とやりたいこと • サービスが拡大すると、当然 Trace
や Span が膨らむ • 細かくサンプリングが設定できる が故に、最適解を模索中 • 少数のエンジニアでも、より効率的 な SRE 業務を目指したい • 特にコストと見合う使い方を模索中 もしよければ、このあとのネットワーキングで ユースケースが聞けたらいいなと思っています!
Thank you! Shota Ozasa SRE, TimeTree, Inc.
[email protected]
025 TimeTree