Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Resilience Hubの登場が騒がれないなんておかしい!? / Resilience ...
Search
TomoyaKitaura
December 13, 2021
Technology
0
260
Resilience Hubの登場が騒がれないなんておかしい!? / Resilience Hub is the best.
2021/12/13 Tech-in勉強会で発表した資料です。
TomoyaKitaura
December 13, 2021
Tweet
Share
More Decks by TomoyaKitaura
See All by TomoyaKitaura
New Relicの推せるところ・推せないところ / newrelic good and bad
tomoyakitaura
0
190
サービスレベルを管理してアジャイルを加速しよう!! / slm-accelerate-agility
tomoyakitaura
1
310
「頑張る」を「楽しむ」に変換する技術
tomoyakitaura
19
11k
これからの設計で変わること pre:invent2024アップデート速報 / pre:invent2024 network update
tomoyakitaura
1
280
セキュリティ活動をちょっとずつやる戦略を実行した気づき / Incremental Security Initiatives
tomoyakitaura
0
220
社内共通コンテナレジストリを設立して、開発者体験向上を狙ってみた /Establishing container registry to improve DX
tomoyakitaura
2
210
LTワークショップ3日目 / LT Workshop Day 3
tomoyakitaura
0
200
LTワークショップ2日目 / LT Workshop Day 2
tomoyakitaura
0
180
LTワークショップ(1日目) / LT workshop day 1
tomoyakitaura
1
220
Other Decks in Technology
See All in Technology
オープンウェイトのLLMリランカーを契約書で評価する / searchtechjp
sansan_randd
3
630
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
160
【インシデント入門】サイバー攻撃を受けた現場って何してるの?
shumei_ito
0
1.4k
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
290
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
SREのプラクティスを用いた3領域同時 マネジメントへの挑戦 〜SRE・情シス・セキュリティを統合した チーム運営術〜
coconala_engineer
2
550
茨城の思い出を振り返る ~CDKのセキュリティを添えて~ / 20260201 Mitsutoshi Matsuo
shift_evolve
PRO
1
160
15 years with Rails and DDD (AI Edition)
andrzejkrzywda
0
160
インフラエンジニア必見!Kubernetesを用いたクラウドネイティブ設計ポイント大全
daitak
0
290
仕様書駆動AI開発の実践: Issue→Skill→PRテンプレで 再現性を作る
knishioka
2
540
システムのアラート調査をサポートするAI Agentの紹介/Introduction to an AI Agent for System Alert Investigation
taddy_919
2
1.6k
GitLab Duo Agent Platform × AGENTS.md で実現するSpec-Driven Development / GitLab Duo Agent Platform × AGENTS.md
n11sh1
0
110
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
515
110k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.6k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Designing for Timeless Needs
cassininazir
0
130
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
110
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
240
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
120
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
320
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
910
Building an army of robots
kneath
306
46k
How STYLIGHT went responsive
nonsquared
100
6k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
59
42k
Transcript
Resilience Hubの登場が 騒がれないなんておかしい!? ~ とあるSREsが考えたRPO RTOが計測された世界観と野望 ~ 株式会社 mediba Tomoya Kitaura
2021/12/13 Tech-in 1
自己紹介 Tomoya Kitaura @kitta0108 mediba inc. SRE Unit ▪勉強会運営 -
- JAWS-UG コンテナ支部 - JAWS-UG SRE支部 ▪好きなAWSのサービス - Amazon VPC 2
Resilience Hubとは? RPO、RTOなどの耐障害性を定義、追跡、管理を 支援するためのマネージドサービス。 RTO = 目標復旧時間 RPO = 目標復旧時点
3
SREの原則 https://cloud.google.com/architecture/framework/reliability/principles?hl=ja 信頼性は最優先の機能 4
サーバーに対する扱いの変化 その1 https://aws.amazon.com/jp/compliance/shared-responsibility-model/ 例えばAWS責任共有モデル 5
サーバーに対する扱いの変化 その2 https://blog.engineyard.com/pets-vs-cattle 例えばこんな言葉 6 ペットから家畜へ
会場の方への質問 7 サーバーは落ちるという前提で アプリケーションの開発・設計 あるいは考慮している
会場の方への質問 その2 8 - 障害発生時のアプリケーションの 振る舞いを理解している。 - 障害発生時のオートヒーリングによる 復旧時間を計測している。 -
障害発生時の復旧回復時点を理解している。 - 継続的に上記を計測し、改善する仕組みを 取りいれている。 ↑ 必要では??
Resilience Hub活用例 9
まとめ 10 - 信頼性は重要な機能 - 信頼性は重要な機能(大事なことなので) - 僕らは耐久性の管理が必要なのではないか - Resilience
HubはRTO,RPOの追跡管理に使える - FISとの機能連携によりいい感じの継続的計測が可能に。
さいごに 11 より高みを目指した開発を行うことの過程を みんなで楽しんでいきましょう!! ご静聴ありがとうございました!!