Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ゆるくアラート作ってゆるくアラート消してゆるくSREしよう/EasygoingSRECreat...
Search
Msksgm
May 29, 2026
31
0
Share
ゆるくアラート作ってゆるくアラート消してゆるくSREしよう/EasygoingSRECreateAlerts__RemoveAlertsRepeat.pdf
ゆるSRE勉強会 #16 の登壇資料です。
https://yuru-sre.connpass.com/event/388731/
Msksgm
May 29, 2026
More Decks by Msksgm
See All by Msksgm
opentelemetry org に寄贈された opentelemetry-kotlin の紹介/Introducing opentelemetry-kotlin, a contribution to opentelemetry.org
msksgm
0
270
オブザーバビリティコミュニティの近況報告/Recent Updates from the Observability Community
msksgm
1
2.3k
OTel 公式ドキュメント翻訳 PJ から始めるコミュニティ活動/Community activities starting with the OTel official document translation project
msksgm
2
6.1k
例外設計について考えて Kotlin(Spring Boot&Arrow)で実践する/thinking exception design and implementation by kotlin
msksgm
4
4.5k
サーバーサイド Kotlin を学ぶ敷居を下げるための本「ハンズオンで学ぶサーバーサイド Kotlin」を v2 に更新した話
msksgm
1
560
Featured
See All Featured
Code Review Best Practice
trishagee
74
20k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.8k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
190
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
340
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
280
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
530
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
580
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Designing for humans not robots
tammielis
254
26k
Deep Space Network (abreviated)
tonyrice
0
150
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
400
Transcript
Copyright © Henry, Inc. All rights reserved. ゆるくアラート作って ゆるくアラート消して ゆるくSREしよう
ゆるSRE勉強会 #16 株式会社ヘンリー Masaki Sugimoto
Copyright © Henry, Inc. All rights reserved. • はじめに •
ゆるいアラートとゆるくないアラート • ゆるいアラートを実践したことでおきたこと • まとめ 2 目次
Copyright © Henry, Inc. All rights reserved. • 名前 ◦
Masaki Sugimoto(@Msksgm) • 所属 ◦ 株式会社ヘンリー • 現在のロール ◦ レセコン一体型電子カルテ「Henry」のレセコン側のSWE • 過去の経歴 ◦ Yahoo!オークション・Yahoo!フリマの SRE ◦ Yahoo!オークション・Yahoo!フリマの課金システムの SWE • その他 ◦ オブザーバビリティまわりでいろいろやってます 3 はじめに 自己紹介 SNSのアイコン 執筆した 技術同人誌 Observability Conference Tokyo 2025
Copyright © Henry, Inc. All rights reserved. 4 はじめに 会社紹介1
Copyright © Henry, Inc. All rights reserved. 5 はじめに 会社紹介2
Copyright © Henry, Inc. All rights reserved. 発表内容 • もっとゆるくアラートを作って信頼性を高めようという話
• SLI/SLO、エラーバジェット、etc...も SRE だけど、もっと基本的な話 前提 • 登壇者は SWE で、仕様をコードレベルで調査と修正ができる • OpenTelemetry 導入済み、トレースの可視化は Honeycomb を利用 6 はじめに 発表概要
Copyright © Henry, Inc. All rights reserved. Q. みなさん、アラート(広義の意味では通知)は好きですか? A.(多分)「内容による」
嫌なアラート←今日は主にこっち • ずっと鳴り続ける • みんな無視している • オンコール 好きなアラート • 初リリースの動作が正常完了にしたときの通知 7 ゆるいアラートとゆるくないアラート 大前提
Copyright © Henry, Inc. All rights reserved. これもきっといろいろな理由がある。。。 →本来は、鳴らないよりは何倍もマシなはず •
アラートの数が多い • 間違ったアラートが飛んでくる • 昔からあるアラート • そもそも何のアラートかわからん 8 ゆるいアラートとゆるくないアラート 嫌なアラートがうまれる理由
Copyright © Henry, Inc. All rights reserved. それは、多分「ゆるくない」から • 間違ったアラートが飛んでくる
◦ 偽陽性が高い • アラートの数が多い ◦ 意味があれば数は関係ないはずだが、、、減らすきっかけがない • 昔からあるアラート ◦ 「再発防止」で生まれたリアクティブなアラート • そもそも何のアラートかわからん ◦ アラート名がユーザー体験ベースではなくコードベース 9 ゆるいアラートとゆるくないアラート 嫌なアラートがうまれる理由
Copyright © Henry, Inc. All rights reserved. 「ゆるいアラート」とは、プロアクティブに作って後で削除できるアラート 10 ゆるいアラートとゆるくないアラート
ゆるいアラート・ゆるくないアラートの定義 (アラートの) ゆるい ゆるくない 偽陽性 低い 高い 目的 明確 不明瞭 作成経緯 プロアクティブ リアクティブ ユーザー体験の悪化が わかる わからない 表:「ゆるいアラート」と「ゆるくないアラート」
Copyright © Henry, Inc. All rights reserved. オブザーバビリティが高い環境では、偽陽性が低いアラートを作れる(と思う) →ユーザー体験の悪化と不具合の原因箇所を追いやすい 11
ゆるいアラートとゆるくないアラート ゆるくアラートを作るために 2000 span 以上あるトレース エラーSpanを含むトレース エラーSpan① エラーSpan②
Copyright © Henry, Inc. All rights reserved. • 「目的」と「削除条件」を記述する ◦
アラートの目的を複数もたせない。 ◦ ただし、単純にやるとアラートが増える。 ◦ 減らすきっかけを、作るために「削除条件」を書く 12 ゆるいアラートとゆるくないアラート ゆるくアラートを作るために アラートの目的 アラートの削除条件
Copyright © Henry, Inc. All rights reserved. • ユースケース1 ◦
リリース中に操作すると100%エラーが発生しユーザーの業務に影響を与えるが、利用頻度が 低いためリスク低と判断し通常リリース ◦ 発生したときの緊急度高 • ユースケース2 ◦ 特定のお客様の環境で発生したエラー。なぜか途中で収束したため、根本原因わからず ◦ 発生したときの緊急度高 13 ゆるいアラートを実践したことでおきたこと 事例
Copyright © Henry, Inc. All rights reserved. • ユースケース1 ◦
リリース中に操作すると100%エラーが発生しユーザーの業務に影響を与えるが、利用頻度が 低いためリスク低と判断し通常リリース ◦ 発生したときの緊急度高 • ユースケース2 ◦ 特定のお客様の環境で発生したエラー。なぜか途中で収束したため、根本原因わからず ◦ 発生したときの緊急度高 14 ゆるいアラートを実践したことでおきたこと 事例 どちらもアラート が発生
Copyright © Henry, Inc. All rights reserved. • ユースケース1 ◦
別件でエラーが発生して通知がきた。想定とは違ったけど初動は早かった • ユースケース2 ◦ シンプルに再発した。CSに即座に問い合わせて、状況再現が早かった 15 ゆるいアラートを実践したことでおきたこと 事例 あれ、ゆるいアラートつけているけど、 ユーザー体験悪化させているし信頼性低くない。。。? 🤔
Copyright © Henry, Inc. All rights reserved. • 「いやなアラート」は「偽陽性」「数が多い」「目的が曖昧」 ◦
アラートを無視して、最悪 Slack 通知をオフにする。「アラートはある」が無視している ◦ 「ゆるくない」(「とりえあず」、「再発防止」、etc...)理由で作られた可能性が高い • 「今回のアラート」は「真陽性」「限定的」「目的が明確」 ◦ 対応しないといけないことが明確。アラートが鳴ってよかった ◦ 目的を終えたので削除した ◦ 「ゆるく」(自発的に、あとで消せば良いや、etc...)から始まった 16 ゆるいアラートを実践したことでおきたこと ふりかえり
Copyright © Henry, Inc. All rights reserved. • 「ゆるいアラート」がワークすると「ゆるさ」をキープする引力が生まれる ◦
他のSWEが手動計装したり、オブザーバビリティが低い箇所の改善を始めた ◦ ユーザー体験に応じたアラートを増やすことに躊躇しなくなった ◦ 最も簡単な SREing を継続できている • 現在の課題 ◦ メトリクスベースのアラートとの併用 ◦ 現在は解決できないアラートと遭遇していないが、遭遇したときに偽陽性が上がる 17 ゆるいアラートを実践したことでおきたこと 現在
Copyright © Henry, Inc. All rights reserved. • 「ゆるいアラート」と「ゆるくないアラート」を紹介 •
「ゆるいアラート」にするために、目的と削除条件を明確にした • 「ゆるいアラート」が適切に鳴って、顧客体験を守った • 「ゆるさ」をキープし始める動きが生まれた 18 まとめ 発表まとめ
Copyright © Henry, Inc. All rights reserved. 採用情報や事業や技術について、積極的に発信しています! 採用情報 採用募集ページ
募集中の採用ポジションや募集要項 がご確認いただけます。 オープンポジションのカジュアル面 談も募集していますので、お気軽に お申し込みください。 技術ブログ はてなブログ ヘンリー製品開発チームが運営する 技術ブログです。 会社公式ブログ note ヘンリーで働く人や医療業界や事業 のことが幅広くしれる公式ブログで す。 CEO の逆瀬川も個人で NOTE を発 信しているのでぜひ! 理想駆動ラジオ Spotify プロダクト開発・運営の様子をお届 けするポッドキャストです。 19