Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Snapshot & Backup
Search
Takuya Shibata
PRO
October 06, 2020
Technology
4.2k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Snapshot & Backup
社内勉強会で発表した内容です。
Takuya Shibata
PRO
October 06, 2020
More Decks by Takuya Shibata
See All by Takuya Shibata
意外とあった SQL Server 関連アップデート + Database Savings Plans
stknohg
PRO
0
560
AWSのProductのLifecycleについて
stknohg
PRO
0
630
アップデート紹介:AWS Data Transfer Terminal
stknohg
PRO
0
700
CloudFrontの継続的デプロイを試してみたはなし
stknohg
PRO
0
1.6k
AWSエンジニアのためのActive Directory入門
stknohg
PRO
1
3.6k
EC2 Image Builder
stknohg
PRO
0
550
Windows on AWS の “基礎”
stknohg
PRO
0
950
Azure Dedicated Host と2019年10月1日からのライセンス改定のはなし
stknohg
PRO
0
620
Windows on AWS 入門
stknohg
PRO
0
670
Other Decks in Technology
See All in Technology
新規事業を牽引する技術選定 〜フルスタックTypeScript開発の実践事例〜
nullnull
3
350
個人最適 から 全体最適 へ AI情報共有会・AIギルド・AI-DLC で進める カンリーの組織展開
rfdnxbro
0
1.5k
AI-DLCを活用した高品質・安全なAI駆動開発実践 / AI Driven Development
yoshidashingo
1
360
Oracle Cloud Infrastructure IaaS 新機能アップデート 2026/3 - 2026/5
oracle4engineer
PRO
1
190
JEP 522 Deep Dive - G1 GC同期コスト削減によるスループット向上を徹底検証&解説
tabatad
1
850
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
50k
美味しいスイスチーズを作ろう🧀🐭
taigamikami
1
240
OCI Oracle AI Database Services新機能アップデート(2026/03-2026/05)
oracle4engineer
PRO
0
220
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.8k
速さだけじゃない! VoidZero ツールが移行先に選ばれる理由
mizdra
PRO
6
750
AI フレンドリーなエラー監視を TypeScript で実現する
shinyaigeek
2
260
JJUG CCC 2026 Spring AI時代の開発こそ標準化を武器に! ― 方式・プロセス・プラットフォームの標準化
s27watanabe
2
720
Featured
See All Featured
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
770
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
480
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
170
Ruling the World: When Life Gets Gamed
codingconduct
0
250
Color Theory Basics | Prateek | Gurzu
gurzu
0
350
Testing 201, or: Great Expectations
jmmastey
46
8.2k
Why Our Code Smells
bkeepers
PRO
340
58k
Skip the Path - Find Your Career Trail
mkilby
1
140
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
Transcript
Snapshot & Backup 2020.10.06 第54回 このサービスは俺に聞け勉強会 (クラスメソッド社内勉強会) Takuya Shibata
2 自己紹介 Takuya Shibata - AWS事業本部 コンサルティング部 - ソリューションアーキテクト -
2018年12月入社 - Microsoft MVP (PowerShell) - 好きなAWSサービス
3 はじめに 私はストレージガチ勢ではありません 発表内容に誤りがある場合はやさしく ご指摘いただけると助かります
4 今日お伝えしたいこと Snapshot ≠ Backup スナップショットはバックアップではない
5 今日お伝えしたいこと Snapshot ≠ Backup スナップショットは バックアップになる場合もある
6 ご清聴ありがとうございました?
7 アジェンダ 1. スナップショットとは? 2. スナップショットとバックアップ 3. AWSにおけるスナップショット • Amazon
EBS編 • Amazon RDS編 • その他サービス
8 スナップショットとは?
9 スナップショット ここで言う「スナップショット」はもちろん ストレージデバイスにおけるスナップショット • ストレージデバイス上の特定時点におけるイメージ
10 スナップショットの方式 代表的なスナップショットの方式 1. Clone / Split mirror 2. Copy
on Write (COW) 3. Redirect on Write (ROW) 4. Copy on Write + Background copy
11 1. Clone / Split mirror • 単純に実データの複製を取るClone • コピー中は複製元に対する書き込みを止める必要有り
12 1. Clone / Split mirror • ミラーリングしているボリュームを切り離し、 その間にCloneを取るSplit mirror
13 2. Copy on Write (COW) • スナップショット取得時はメタデータをコピー • データ更新時に当該領域のコピーを生成
14 3. Redirect on Write • スナップショット取得時はメタデータをコピー • データ更新時は新領域に書き込み
15 4. Copy on Write + Background copy • 基本はCopy
on Write • スナップショット取得と同時にCloneを作成開始
16 スナップショット と バックアップ
17 スナップショットとバックアップ スナップショットはバックアップになるか? 方式 複製の有無 バックアップになるか Clone / Split mirror
〇 〇 Copy on Write × × Redirect on Write × × Copy on Write + Background copy 〇 〇
18 スナップショットとバックアップ バックアップの要件として データが複製されることは必須
19 シンプルな問い データが複製されていれば バックアップ足りえるのか?
20 バックアップの整合性 (Consistency) バックアップがバックアップ足りえるためには、 対象に応じた整合性(Consistency)が求められる 整合性が無ければ壊れたデータの複製に過ぎない • (ストレージ)デバイスとしての整合性 • ファイルシステムとしての整合性
• OSとしての整合性 • アプリケーションとしての整合性
21 (ストレージ)デバイスとしての整合性 大抵の場合ストレージデバイスは固有のブロックサイズ 単位でデータを保持する • ブロックコピー中の状態で複製されない 大抵のストレージデバイスはキャッシュを持つ • キャッシュ上のデータがデバイスに書き出されて いる
• デバイスのメタデータと実データが一貫している
22 ファイルシステムとしての整合性 デバイスと同様にファイルシステムもブロックサイズ 単位でデータを保持する • ブロックコピー中の状態で複製されない 大抵のファイルシステムもキャッシュを持つ • キャッシュ上のデータがファイルに書き出されて いる
• ファイルシステムとしてデータが一貫している
23 OSとしての整合性 OSはファイルシステム上の各種ファイルの集合体 • ファイルシステムとしての整合性がある • 構成するファイルが不足なく複製されている OSは性能のため様々なキャッシュを持つ • メモリ上のデータがファイルに書き出されている
• OS全体として一貫している
24 アプリケーションとしての整合性 アプリケーションはOS上に構成されるが、OSの状態 に依存しないことも多い • ファイルシステムとしての整合性がある • 構成するファイルが不足なく複製されている アプリケーションの種類によってはキャッシュを持つ こともある
• メモリ上のデータがファイルに書き出されている • アプリケーション全体として一貫している
25 整合性を保つための重要な要素 • スナップショット取得中のデバイスへの書き込みを どう防ぐか? • スナップショット取得に際し中途半端なコピーを どう防ぐか? • スナップショット取得時にキャッシュ(メモリ)上の
データをどう書き出すか? • 対象における「整合性」の定義を把握する
26 AWSにおけるスナップショット (Amazon EBS編)
27 Amazon EBS スナップショット ポイントインタイムスナップショットを作成することで、Amazon EBSボリュームのデータを Amazon S3 にバックアップできます。スナップショットは増分バックアップです。つまり、最後に スナップショットを作成した時点から、ボリューム上で変更のあるブロックだけが保存されます。こ
れにより、スナップショットを作成するのに要する時間が最小限に抑えられ、データを複製しないこ とで、ストレージコストが節約されます。各スナップショットには、(スナップショットを作成した 瞬間から) データを新しい EBS ボリュームに復元するために必要な情報がすべて含まれます。 スナップショットに基づいて EBS ボリュームを作成すると、新しいボリュームは、スナップショッ トの作成に使用された元のボリュームの完全なレプリカとなります。すぐに使用を開始できるよう、 レプリケートされたボリュームはバックグラウンドでデータを読み込みます。まだ読み込まれていな いデータにアクセスした場合、ボリュームは要求されたデータを Amazon S3 から即座にダウン ロードし、引き続きボリュームの残りのデータをバックグラウンドで読み込みます。詳細については、 「Amazon EBS スナップショットの作成」を参照してください。 https://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/EBSSnapshots.html
28 Amazon EBS スナップショット EBSスナップショットの実装方式は非公開 • Copy on Write +
Background copyに近い (+増分も) • S3に複製を作成するためバックアップ足りえる
29 Amazon EBS スナップショット EBSスナップショットの整合性は「クラッシュ整合性」 (ただし、なぜかドキュメントでは明言されていない…) • デバイスとしての整合性 ファイルシステム/OS/アプリケーションレベルの 整合性では無い
このためいくつかの追加機能が提供されている • マルチボリュームクラッシュ整合性 • Volume Shadow Copy(VSS)を使った アプリケーション整合性を保ったスナップショット
30 マルチボリュームクラッシュ整合性 EC2インスタンスに紐づく複数のEBSボリュームに 対し同時にスナップショットを取得 • 複数EBSでRAIDを組んでいる場合などに有効
31 VSSを使ったスナップショット Volume Shadow Copy (VSS)の機能を使い、 アプリケーション整合性を持ったスナップショットを取得 • Windows EC2インスタンス専用機能
• 専用コンポーネント+SSM Run Commandを使用
32 AMI作成時の大事なオプション 「インスタンスの停止」は整合性を取る一番わかりやすい方法
33 AMI作成時の大事なオプション インスタンスを停止せずに取得したAMI(EBS)は 「掃除のおばちゃんが稼働中サーバーの電源 ケーブルを引っこ抜いた状態」 に近い (注:おばちゃん以外の清掃員の場合も同様である) • メモリ上にあるデータが保存されていない
34 余談 EBSスナップショットの増分管理については以下の EBS Direct APIの紹介記事がわかりやすい • https://aws.amazon.com/jp/blogs/aws/new-programmatic-access-to-ebs-snapshot-content/
35 AWSにおけるスナップショット (Amazon RDS編)
36 DBスナップショット Amazon RDSの物理バックアップ方式として 「DBスナップショット」が提供されている • DBスナップショットの実装方式は非公開 • EBSスナップショットを拡張したものに見受けられる •
RDBMSはそれぞれ固有の方式で整合性を保つ物理バックアップ が可能であり、おそらく、 DBスナップショットはそれを実装 していると予想 • スナップショットの整合性はAWSが担保 • 明記されたドキュメントは無い、が、そもそも論として 整合性を担保してくれないとリストアできない…
37 AWSにおけるスナップショット (その他サービス)
38 その他サービスのバックアップと整合性 • 主要なAWSサービスのバックアップ方式は非公開 • 手動バックアップはスナップショットを使ったものに見受けられる • とはいえ、EFSのバックアップはスナップショットを使ってなさそうだが… サービス バックアップ方式
整合性に関する記述 備考 Amazon Aurora 非公開 ・バックアップの保存先 はS3 「Aurora のバックアップは継続的 かつ増分的であるため、バック アップ保持期間の任意の時点にす ばやく復元できます」 自動または手動バック アップ Amazon DynamoDB 非公開 ・バックアップの保存先 はS3とされる 「DynamoDB バックアップでは、 項目間の因果整合性は保証されま せん。ただし、バックアップの更 新間のスキューは、通常 1 秒未満 です」 自動またはオンデマン ドバックアップ Amazon EFS 非公開 ・AWS Backupによる独自 方式 ・増分バックアップ 「バックアップの実行中にファイ ルシステムに変更が加えられると、 データの重複、相違、欠落などの 不整合が生じる場合があります」 2020年7月から自動 バックアップもサポー ト
39 まとめ Snapshot ≠ Backup スナップショットはバックアップではない
40 まとめ Snapshot ≠ Backup スナップショットは バックアップになる場合もある
41