Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Aurora Serverless v2 移行への道
Search
CREATIVE SURVEY Inc.
July 04, 2023
Technology
0
490
Amazon Aurora Serverless v2 移行への道
第31回 ちょっぴり DD / AWS Dev Day 2023 Tokyo 延長戦の資料です。
CREATIVE SURVEY Inc.
July 04, 2023
Tweet
Share
More Decks by CREATIVE SURVEY Inc.
See All by CREATIVE SURVEY Inc.
スタートアップのデータ基盤2年目におけるデータプロダクトへの挑戦 / challenge-to-data-products-in-the-second-year-of-startup-data-platform
creativesurvey
0
42
プロダクトの持続的成長を実現するための開発体制作り
creativesurvey
0
260
dbt testを導入した話
creativesurvey
0
590
SnowflakeのCI/CDフローを整備した話 / snowflake-cicd-flow-maintenance
creativesurvey
0
900
【技術負債も解消しつつ顧客価値を最大化】ストリームアラインドチームでの挑戦と成果
creativesurvey
0
56
プロダクトエンジニアを支えるSREの動きと理想
creativesurvey
0
280
クリエイティブサーベイ社でのStreamlit活用事例
creativesurvey
0
350
STI導入で開発スピードアップ!一元管理で外部連携をスムーズに
creativesurvey
0
72
新規機能の開発における_早く価値を届ける開発の取り組み.pdf
creativesurvey
0
140
Other Decks in Technology
See All in Technology
OCI技術資料 : ファイル・ストレージ 概要
ocise
3
11k
TSKaigi 2024 の登壇から広がったコミュニティ活動について
tsukuha
0
170
多様なメトリックとシステムの健全性維持
masaaki_k
0
120
LINE Developersプロダクト(LIFF/LINE Login)におけるフロントエンド開発
lycorptech_jp
PRO
0
150
Google Cloud で始める Cloud Run 〜AWSとの比較と実例デモで解説〜
risatube
PRO
0
120
なぜCodeceptJSを選んだか
goataka
0
190
成果を出しながら成長する、アウトプット駆動のキャッチアップ術 / Output-driven catch-up techniques to grow while producing results
aiandrox
0
400
プロダクト開発を加速させるためのQA文化の築き方 / How to build QA culture to accelerate product development
mii3king
1
300
いまからでも遅くないコンテナ座学
nomu
0
150
Storage Browser for Amazon S3
miu_crescent
1
300
スケールし続ける事業とサービスを支える組織とアーキテクチャの生き残り戦略 / The survival strategy for Money Forward’s engineering.
moneyforward
0
110
社内イベント管理システムを1週間でAKSからACAに移行した話し
shingo_kawahara
0
210
Featured
See All Featured
Making Projects Easy
brettharned
116
6k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.5k
RailsConf 2023
tenderlove
29
940
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.2k
Measuring & Analyzing Core Web Vitals
bluesmoon
5
180
Code Reviewing Like a Champion
maltzj
521
39k
Fontdeck: Realign not Redesign
paulrobertlloyd
82
5.3k
The Pragmatic Product Professional
lauravandoore
32
6.3k
Git: the NoSQL Database
bkeepers
PRO
427
64k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
365
25k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Mobile First: as difficult as doing things right
swwweet
222
9k
Transcript
第31回 ちょっぴり DD / AWS Dev Day 2023 Tokyo 延長戦
Amazon Aurora Serverless v2 移行への道 2023.06.29
自己紹介 鈴木康寛 クリエイティブサーベイ株式会社 CTO 2013年にSansan入社。 webアプリケーションエンジニアとして、 Eightの開発に従 事。サーバーレスアーキテクチャを用いた、リコメンデー ションサービスに関して、 2017
AWS Dev Dayにて登 壇。 その後、エンジニアリングマネージャーの経験を経て、昨 年6月より現職。 yasuzukisan
None
今年よりSansanグループに参画
ミッション 顧客の声を機会に変える
アンケートサービスの特性 大規模なスパイク
スケーラビリティとの戦い 2022/6: CTO就任 2022/6〜: 諸々の技術的負債への対応 • Ruby/Rails/MySQLバージョンアップ • 開発環境のコンテナ化 •
CI / CDパイプライン整備によるデプロイの自動化 2022/12: EC2ベースからECS on Fargateベースになり、オートスケーリン グが可能に
データベースの変遷 2022/6〜: MySQLバージョンアップ • 5.7から8.0へ • DATETIME型の比較で明示的にCASTが必要だった • 上記対応をして5.7系の環境に事前にバックポート 2022/12:
RDS for MySQL から Amazon Auroraへ移行 • Aurora MySQL version 3.02.1
Auroraの利用状況 • プロビジョニングされたインスタンス • インスタンスタイプ: db.r6g.4xlarge 平常時はCPU負荷10%以下
DBもオートスケーリング できないか? 🤔
Aurora Serverless v2
要件の確認 • Serverless V1よりもスケーリングの応答性が高く、高可用性 • Aurora MySQL version 3.02.1 のため、移行可能
• 同等性能(ACU換算)では、プロビジョニングされたインスタンスよりも 高価 ◦ アンケートサービスの特性にマッチ
切り替え方法は? • Amazon Aurora Blue/Green Deployments • 昨年のRe:Inventで発表 ◦ 使えるなら使いたい
• 1分程度のダウンタイムで本番DBへ昇格 ◦ 顧客影響を最小限に
ということで、 無事移行できました 🎉
Blue/Greenデプロイメントの事前準備 • サービスの停止を伴うもの ◦ binlogの設定を変更 ▪ `binlog_format`のパラメータ値をMIXEDに変更 • サービスの停止を伴わないもの ◦
Blue/Green の構成 ▪ Green環境を Serverless v2に変更 ◦ Terraformの微修正 ▪ 構成管理上の軽微なもの
Blue/Green環境構築コスト • 一時的にGreen環境のインスタンスを立ち上げる必要がありコストが かかる 準備作業により、コ スト増 移行後
Blue/Greenデプロイメントの実施 • 事前準備を済ませ、AWSコンソール上からスイッチオーバー ◦ 1,2分で切り替え完了し、Serverless v2のDBが適用 • 移行時の苦労話は? ◦ 特に苦労はなかった
◦ Terraform の構成管理についても事前対応のおかげで、運用が 変わることはなかった
移行後の影響(コスト) • 1日あたりの平均コスト ◦ $136 -> $101 (約25.7%削減) 日によっては 移行前よりも増加
移行後コスト減
移行後の影響(パフォーマンス) • SLIとして設定していた、p90, p99のLatencyが悪化 ◦ 事前の性能検証で影響範囲ないと想定 ◦ p99に関してはより顕著な影響 移行後にLatency悪化
移行後の運用 • ACU(Aurora Capacity Unit)について ◦ Serverless v2のキャパシティ単位 ◦ 1ACU当り、2GiBのメモリに相当
◦ 移行前のdb.r6g.4xlarge相当は、64ACU • ACUの設定 ◦ Min ACU: 2 ◦ Max ACU: 64 ▪ 移行前のインスタンスと同等性能に設定
移行後の問題点 • 移行当初の問題 ◦ Min: 0.5ACUにしていたため、負荷に追従しきれなかった ◦ パフォーマンスインサイトの設定を有効にしているため、推奨値の Min ACU:
2に設定 • 定期的にフェイルオーバーが発生 ◦ サービス影響は軽微ではある ◦ サポートに問い合わせ、AWS側の問題である可能性 ◦ Auroraのバージョンが若干古いことに起因?
今後について • データベースアクセスのチューニングが必要 ◦ 過剰なスペックのDBを利用していたことで問題が隠蔽 • SLIの妥当性検証 ◦ p99のLatencyについて再考が必要 •
フェイルオーバーへの対策 ◦ Auroraのバージョンを最新化(3.03.1)して様子見 ▪ Blue/Greenデプロイメントを活用
まとめ 📝
まとめ • 通常時とピーク時のアクセス特性が大きく異なるアプリケーションにお いてAurora Serverless v2は有用な選択肢 • Blue/Green DeploymentsによるDBの構成変更が容易に •
オートスケールする仕組みだからこそ、DBのパフォーマンスチューニン グは不可避