Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
2024/10 PagerDuty機能アップデート
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Kazuto Kusama
October 23, 2024
Technology
180
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
2024/10 PagerDuty機能アップデート
Kazuto Kusama
October 23, 2024
More Decks by Kazuto Kusama
See All by Kazuto Kusama
自宅LLMの話
jacopen
1
700
プラットフォームエンジニアリングはAI時代の開発者をどう救うのか
jacopen
9
5.4k
OpenClawで回す組織運営
jacopen
3
1.2k
SREの仕事を自動化する際にやっておきたい5つのポイント
jacopen
6
1.6k
AI時代のインシデント対応 〜時代を切り抜ける、組織アーキテクチャ〜
jacopen
4
400
AI時代の開発とPlatform Engineeringについて考える
jacopen
0
240
AI によってシステム障害が増える!? ~AI エージェント時代だからこそ必要な、インシデントとの向き合い方~
jacopen
4
410
インシデント対応に必要となるAIの利用パターンとPagerDutyの関係
jacopen
0
430
今日からはじめるプラットフォームエンジニアリング
jacopen
8
5.1k
Other Decks in Technology
See All in Technology
10年間のブログ発信を振り返って見えたWebアプリケーションエンジニアとしての軌跡
stefafafan
0
170
【Snowflake Summit 2026 Recap!!】Snowflake Summit Deep Dive: Security & Governance
civitaspo
1
290
【2026年版】 ベクトル検索とEmbedding最前線
mocobeta
23
7k
AWS Security Hub CSPMの成功・失敗体験
cmusudakeisuke
0
440
Bucharest Tech Week 2026 - Guardians of the Cloud-Native Galaxy
edeandrea
PRO
0
130
When Platform Engineering Meets GenAI
sucitw
0
150
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
290
GitHub Copilot app最速の発信の裏側
tomokusaba
1
230
不要なレビューをAIにまかせて AIコーディングの環境改善を加速した
shoota
1
250
あなたの知らないPDFのアクセシビリティ
lycorptech_jp
PRO
0
230
起点・思考・出力で分解する 〜PM業務の自動化設計〜
kazu_kichi_67
0
120
コミュニティの有益性 ~JAWS Days 2026 での体験を通して~ / The Benefits of a Community ~Through My Experience at JAWS Days 2026~
seike460
PRO
0
250
Featured
See All Featured
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1.1k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
320
Game over? The fight for quality and originality in the time of robots
wayneb77
1
200
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.4k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
260
Leo the Paperboy
mayatellez
7
1.9k
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
Rails Girls Zürich Keynote
gr2m
96
14k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
390
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
370
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
71
40k
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
1
540
Transcript
PagerDuty 機能アップデート 2024年10⽉
Agenda - PagerDuty Operations CouldとE2Eインシデント管理 - 機能アップデート - PD Advance:
⽇本語対応 + MS Teams対応 - Event Orchestration: External Data Variables - Dynamic EP & Service Reassignment - Alert Grouping: Global, Unified, and Enhanced pattern recognition - Incident Types - Operational Maturity: Top Recommendations & Benchmarks - Automation Use Case Library https://www.pagerduty.com/automation/
動員 解決 ⽂書化 緩和 学習 検知 トリアージ 「インシデント対応」から「E2Eインシデント管理」へ 動員 検知
監視ツールの 整理‧統合 担当者の通知 インシデント管理として、考慮すべきプロセス全体: 最初にテコ⼊れが検討されるプロセス: インシデントの特定 ⾃動処理 原因を素早く特定 関係者にリアルタイムで状況を共有 運⽤状況の可視化 運⽤プロセスの改善 検知と動員だけでは解決できない課題: • 担当者の負担増 • 解決までに時間がかかる • インシデント対応の可視化と改善 3
Automation Monitoring - On-prem DC ChatOps & Collaboration ITSM/Ticket管理 Code/Config
Management AI-Based Foundational Data Model PagerDuty Operations Cloud インシデント管理プロセスをEnd-to-Endで標準化 4 動員 解決 記録 緩和 学習 検知 トリアージ 改善 分析 Monitoring - Public Cloud Customer Service Security JP1 Senju Systemwalker Event-Driven Human-in- the-Loop エンドユーザー CEO/CIO/CTO カスタマーサービス 運⽤担当者 あらゆるツールから Eventを集約 - 700+ Integrations - Email 開発者 Status Page
PagerDuty Operations Cloud リファレンスアーキテクチャ
状況を教えて 以前の類似インシデントは どうやって解決した? 最近⾏った変更は? ⽇本語(GA)‧MS Teams(EA)のサポート
Event Orchestration: Variables利⽤したルー ルを評価‧実⾏ Proprietary & Confidential (Optional) Incident Workflow
からExternal Variableを更新 外部データ Event B Event A API Event Orchestration Rules (GA) Event Aに関する条件を元に、 Event Aの処理を実⾏ EO Variables (GA) Event Bに関する条件を元に、 Event Aの処理を実⾏ External Data Variables (EA) 任意の外部データに関する条件を 元に、Event Aの処理を実⾏ Event Orchestration Variables 他Eventや外部のデータを参照し、柔軟なEvent Ruleを作成
Dynamic Escalation Policy サービス構成を維持したまま、柔軟な通知先の制御を実現 Proprietary & Confidential 課題: Technical ServiceにEscalation
Policy が紐づいているため、同⼀Service内で 通知先メンバーを動的に変更すること が難しかった。 例) P1相当のインシデントは、通常のイ ンフラメンバーではなく、SREチームを 直接アサインしたい Dynamic EPによる解決: Event Orchestration Ruleで、動的にEP を変更できるように
Proprietary & Confidential 動的にインシデント のエスカレーション 先を変更 - イベントデータに基づいてエ スカレーションポリシーを動 的に割り当てることで、適切
な対応者に通知されるように - 組織内のインシデント対応を ⼀元管理 Dynamic Escalation Policies GA (Generally Available) AIOps only
Proprietary & Confidential - インシデントを扱うのに最 適なサービスに、インシデン トを再割り当て - 適切な専⾨家、データ、レ ポートが割り当てられること
で、対応をスムーズに - ServiceNowなどのITSMツ ールとの双⽅向同期を強化し 、チケットとPagerDutyイン シデント間でサービス変更を 整合させます Service Reassignment 正しいサービスに インシデントを移動 EA (Early Access) - 2025年1⽉ 頃
Service 2 Service 1 Service 2 Service 1 Proprietary &
Confidential Alert Groupingの進化 Groupingの範囲拡⼤と精度向上 Incident A Incident B Incident A Global Alert Grouping 従来のAlert Grouping Unified Alert Grouping: Intelligent (ML) と Content-Based を組み合わせて利⽤可能に Enhanced Pattern Recognition: MLのパターン判定に利⽤するフィールドの拡⼤‧カスタマイズ 件名 (アラートのタイトル) → 最⼤5つまで任意のフィールドを指定可能に
Proprietary & Confidential サービスをまたいで アラートをグループ化 し、ノイズを削減 - 複数のサービスにわたるア ラートのグループ化により、 ノイズ削減を効率化
- MLによるIntelligentモード またはコンテンツベースのア ラートグループ化を利⽤ Global Alert Grouping Intelligent/Content (GA) Unified (EA) AIOps only
Proprietary & Confidential 2つのグルーピング モードを併⽤し、 ノイズ削減の精度 を向上 - インテリジェント(ML)モードと コンテンツベースのアラートグ
ループ化を組み合わせ得ること で、最⼤限のグルーピングの精 度を向上 - コンテンツベースのルールを作 成することで、MLによるグルー ピングを⾏う対象を制限します Single Service (GA) Global (EA) AIOps only Unified Alert Grouping
Proprietary & Confidential MLに追加のメタデー タを適⽤し、グルーピ ング精度を向上 - アラートの類似性を判断する ためのFieldを追加指定すること が可能に
- アラートのタイトルを変更す ることなく、グルーピングの精 度を向上 Enhanced Pattern Recognition EA GA 2025年1⽉頃 AIOps only
Proprietary & Confidential Incident Types インシデントの種類を定義し、利⽤するCustom FieldsやIWを変更 Incident Typeに合わせて制御でき る項⽬:
- Custom Fields - Incident Workflows - ChatOps - Status Update Notifications - ServiceNow - Analytics インシデントの重⼤度 担当部署/サービス インシデントの種類 Base Incident Major Incident Security FinOps App A App B
Proprietary & Confidential Incident Types - PagerDutyのインシデントを独 ⾃のビジネスプロセスに合わせ ることができ、より正確な対応 と調整が可能になります。
- 重⼤インシデント、セキュリテ ィインシデントなど、さまざま なインシデントに対応するカス タム対応プロセスを推進できま す。 - 適切なプロセスに沿ってチーム が時間を節約し、対応中に重要 な⼿順の⾒落としを回避できる よう⽀援します ビジネスプロセスに 合わせて、インシデ ントを分類 Early Access: (w/ Slack, MS Teams, Mobile and Analytics support) GA: 2025年1⽉頃 (w/ ServiceNow ITSM and Analytics for Custom Fields)
Proprietary & Confidential パーソナライズされた推奨事項に より、運⽤成熟度を向上させるた めに最も効果的なアクションを迅 速に特定できます。 業界ベンチマークにより、お客様 のパフォーマンスが同様の企業と ⽐較してどの程度であるかを確認
できます。 これらの指標は連携して機能し、 改善が必要な領域を特定し、アク ションの優先順位付けを⽀援しま す。 Recommendations (GA) Benchmarks - GA 2025年1⽉頃 Recommendati ons & Benchmarking 運⽤改善につなが る実践的な提案
Benchmarks to drive operational maturity Operational maturity model
Innovations to scale & standardize automation PagerDuty Automation Use Case
Library https://www.pagerduty.com/automation/
PagerDuty Resources PagerDuty クイックガイド(⽇本語) - 利⽤ガイド https://qiita.com/ymotomu/items/42f825accbfca287464a - 設定ガイド https://qiita.com/ymotomu/items/e6d13e5284a62e3a1100
PagerDuty 株式会社公式HP (無料トライアル申込み/導⼊事例/価格) https://www.pagerduty.co.jp/ PagerDuty 公式ユーザードキュメント https://support.pagerduty.com/lang-ja/docs Integration Guide (モニタリングツール‧コラボレーションツール等との連携⽅法) https://www.pagerduty.com/integrations/ インシデント対応プロセスのベストプラクティス (英語) https://response.pagerduty.com/ (有志のユーザー様による⽇本語翻訳版) 20
None