Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Resilience Hubの登場が騒がれないなんておかしい!? / Resilience ...
Search
TomoyaKitaura
December 13, 2021
Technology
0
220
Resilience Hubの登場が騒がれないなんておかしい!? / Resilience Hub is the best.
2021/12/13 Tech-in勉強会で発表した資料です。
TomoyaKitaura
December 13, 2021
Tweet
Share
More Decks by TomoyaKitaura
See All by TomoyaKitaura
セキュリティ活動をちょっとずつやる戦略を実行した気づき / Incremental Security Initiatives
tomoyakitaura
0
87
社内共通コンテナレジストリを設立して、開発者体験向上を狙ってみた /Establishing container registry to improve DX
tomoyakitaura
2
170
LTワークショップ3日目 / LT Workshop Day 3
tomoyakitaura
0
140
LTワークショップ2日目 / LT Workshop Day 2
tomoyakitaura
0
130
LTワークショップ(1日目) / LT workshop day 1
tomoyakitaura
1
140
これまでの監視とクラウド時代の監視 / Monitoring the Past and the Cloud
tomoyakitaura
1
220
エンタープライズにおけるSRE立ち上げとNew Relic選定に至った背景とは / SRE Startup and New Relic in the Enterprise
tomoyakitaura
2
720
AWSとNew Relicのデータ連携を超高速で実装した話 / The story of a super-fast implementation of data integration between AWS and New Relic
tomoyakitaura
0
1.4k
セキュリティ勉強会 / How do we confront the threat
tomoyakitaura
0
120
Other Decks in Technology
See All in Technology
Taming you application's environments
salaboy
0
200
DynamoDB でスロットリングが発生したとき/when_throttling_occurs_in_dynamodb_short
emiki
0
270
OCI Network Firewall 概要
oracle4engineer
PRO
0
4.2k
OCI Vault 概要
oracle4engineer
PRO
0
9.7k
LINEヤフーにおけるPrerender技術の導入とその効果
narirou
1
200
TypeScript、上達の瞬間
sadnessojisan
48
14k
安心してください、日本語使えますよ―Ubuntu日本語Remix提供休止に寄せて― 2024-11-17
nobutomurata
1
1k
開発生産性を上げながらビジネスも30倍成長させてきたチームの姿
kamina_zzz
2
1.7k
Application Development WG Intro at AppDeveloperCon
salaboy
0
200
テストコード品質を高めるためにMutation Testingライブラリ・Strykerを実戦導入してみた話
ysknsid25
7
2.7k
OCI Security サービス 概要
oracle4engineer
PRO
0
6.5k
【LT】ソフトウェア産業は進化しているのか? #Agilejapan
takabow
0
110
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
334
57k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
47
2.1k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
26
2.1k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.8k
How GitHub (no longer) Works
holman
310
140k
KATA
mclloyd
29
14k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
48k
Unsuck your backbone
ammeep
668
57k
Into the Great Unknown - MozCon
thekraken
32
1.5k
Optimising Largest Contentful Paint
csswizardry
33
2.9k
10 Git Anti Patterns You Should be Aware of
lemiorhan
655
59k
Transcript
Resilience Hubの登場が 騒がれないなんておかしい!? ~ とあるSREsが考えたRPO RTOが計測された世界観と野望 ~ 株式会社 mediba Tomoya Kitaura
2021/12/13 Tech-in 1
自己紹介 Tomoya Kitaura @kitta0108 mediba inc. SRE Unit ▪勉強会運営 -
- JAWS-UG コンテナ支部 - JAWS-UG SRE支部 ▪好きなAWSのサービス - Amazon VPC 2
Resilience Hubとは? RPO、RTOなどの耐障害性を定義、追跡、管理を 支援するためのマネージドサービス。 RTO = 目標復旧時間 RPO = 目標復旧時点
3
SREの原則 https://cloud.google.com/architecture/framework/reliability/principles?hl=ja 信頼性は最優先の機能 4
サーバーに対する扱いの変化 その1 https://aws.amazon.com/jp/compliance/shared-responsibility-model/ 例えばAWS責任共有モデル 5
サーバーに対する扱いの変化 その2 https://blog.engineyard.com/pets-vs-cattle 例えばこんな言葉 6 ペットから家畜へ
会場の方への質問 7 サーバーは落ちるという前提で アプリケーションの開発・設計 あるいは考慮している
会場の方への質問 その2 8 - 障害発生時のアプリケーションの 振る舞いを理解している。 - 障害発生時のオートヒーリングによる 復旧時間を計測している。 -
障害発生時の復旧回復時点を理解している。 - 継続的に上記を計測し、改善する仕組みを 取りいれている。 ↑ 必要では??
Resilience Hub活用例 9
まとめ 10 - 信頼性は重要な機能 - 信頼性は重要な機能(大事なことなので) - 僕らは耐久性の管理が必要なのではないか - Resilience
HubはRTO,RPOの追跡管理に使える - FISとの機能連携によりいい感じの継続的計測が可能に。
さいごに 11 より高みを目指した開発を行うことの過程を みんなで楽しんでいきましょう!! ご静聴ありがとうございました!!