Upgrade to Pro — share decks privately, control downloads, hide ads and more …

組織と事業の急拡大に立ち向かうためのマルチテナント Amazon EKS クラスタ/マルチアカ...

0gajun
September 08, 2020

組織と事業の急拡大に立ち向かうためのマルチテナント Amazon EKS クラスタ/マルチアカウントアーキテクチャ / Multi-tenant EKS Muti-account architecture at Money Forward

AWS Summit Online 2020 (https://aws.amazon.com/jp/summits/2020/) の発表資料です

マネーフォワードは創業当初からオンプレミス環境で運用を行ってきましたが、 組織や事業の急拡大に伴いインフラチームがボトルネックとなることが増えてきました。この現状を打破すべくクラウド移行を進めています。 本セッションでは、オンプレミス環境からクラウドへの移行を通じて組織と事業の急拡大にどのように立ち向かおうとしているかについて、 マルチテナントな Amazon EKS クラスタと TransitGateway や DirectConnect を利用したマルチアカウントを用いたアーキテクチャを中心に紹介します。

0gajun

September 08, 2020
Tweet

More Decks by 0gajun

Other Decks in Technology

Transcript

  1. 自己紹介 小笠原 純也 @0gajun • 2018年 4月入社 • サービスインフラグループ •

    全社でのアマゾン ウェブ サービス ( AWS ) 移行のテクニカルリード
  2. 今日話すこと マルチテナント Amazon EKS /マルチアカウントアーキテクチャ 開発フローの変化 マルチテナント Amazon EKS /マルチアカウントへの挑戦

    組織と事業の拡大に伴うインフラにおける課題 マネーフォワードについて カルチャーを変えていく為に まとめ
  3. すべての人生を、 便利で豊かにする。 ビジネスの成長を加速させる。 くらしの経済メディア お金の見える化サービス 金融商品の比較・申し込みサイト 自動貯金アプリ お金を前へ。人生をもっと前へ。 パートナーと共に、 新たな金融サービスを創出する。

    お金をいい方向へと動かす。 for ◦◦ 金融機関お客様向け自動家計簿・ 資産管理サービス 通帳アプリ 金融機関お客様向け通帳アプリ MF Unit 金融機関のアプリへの一部機能提供 企業間後払い決済サービス 売掛金早期資金化サービス BFM 法人向け資金管理サービス 成長企業向けフィナンシャル・ アドバイザリーサービス バックオフィス向け業務効率化ソリューション マネーフォワード MEユーザーのための FP相談窓口 マネーフォワード MEのデータを分析し最 適な行動をアドバイス DX人材特化のキャリア支援サービス
  4. メインサービスのインフラストラクチャ • 2012 年の創業当初からオンプレミス @北海道 ◦ 物理サーバーを購入し、インフラがセットアップし運用 • 数 TB

    の共有メイン DB ◦ 主要サービスの多くがメイン DB を直参照し密結合 • プロダクト共通の実行環境 ◦ 複数プロダクト相乗りサーバー 等が多数存在
  5. Docker + Kubernetes + AWS による移譲 • Docker + Kubernetes

    + AWS によるインフラの移譲 ◦ インフラチームの管理レイヤを徐々にサービスチームへ移していく • 一方、サービスチーム間の独立性はどのようにして保つか? ◦ 各サービスチームは他チームのことを考えずに開発できるようにしたい
  6. マルチテナント Amazon EKS • サービスチームはクラスタ運用が不要 • インフラチームは単一クラスタだけをメンテ ナンス • Namespace

    毎にチーム間の分離が可能 • Blast Radius (障害時の影響範囲) が大きい • サービスチームはクラスタレベルの権限を持 つことはできない ◦ 自由さが制限される Good Bad
  7. シングルテナント Amazon EKS • Blast Radius が最小限 • 各サービスチームがクラスタレベルの権限 を持つことができる

    ◦ 自由度は極めて高い • 管理するクラスタの台数が増えてしまう • 各サービスチームが自分たちでクラスタを管 理しないとスケールしない ◦ その文化や仕組み作りが必要 Good Bad
  8. マルチテナントAmazon EKS vs. シングルテナント Amazon EKS • シングルテナントの Blast Radius

    の小ささ及びチーム毎の自由は非常に魅力 • インフラチームがインフラ全てを見ていた環境から、AWS へ移行した瞬間にクラス タ管理から全部お願い!は Technical Gap が大きすぎる ◦ 多数のシングルテナントクラスタをインフラチームが見るのも 非現実的で運用負荷が高すぎる & 見えない まずはマルチテナントで Namespace 単位での権限移譲を行い、 サービスチームの触ることができる範囲を広げることを最優先 将来的にシングルテナントへの分割を目指すことに
  9. シングルアカウント • 単一アカウントだけなので管理が容易 • 構成がシンプル • 統制も単一アカウントを対象にすれば良い ので導入及び運用が (初期は) 容易

    • IAM Policy の管理が煩雑 & 難しくなりがち ◦ サービスが増えたときの権限移譲のハード ルが上がる • コスト管理では正しく Billing Tag を付与する必 要がある Good Bad
  10. マルチアカウント • アカウント間の Isolation が保たれるので IAM Policy がシンプルに ◦ サービスチームによる

    Role の管理 • BillingTag を付与せずともコスト配賦可 • アカウント管理の手間 • マルチアカウントの統制の仕組みを 作る必要がある • 構成がシンプルではなくなる ◦ VPC 間通信、クロスアカウントアクセス Good Bad
  11. シングルアカウント vs. マルチアカウント • サービスチームが他のサービスに影響なく AWS を利用できるようにしたい • シングルアカウントを多数のサービスチームが利用する形だと、リソース 間の

    Isolation を保つのがかなり大変 • マルチアカウントならアカウントをリソースコンテナとして扱い、 Isolation を 簡単に保つことができる ◦ サービス毎のコスト配賦も簡単に より自由に動ける環境を目指しマルチアカウントを選択 統制やネットワークの課題周りはインフラチームが解決
  12. マルチアカウント 1 / 2 • サービス毎に 別々の AWS アカウントを作成 ◦

    各サービスチームは他プロダクトへの影響を考えずに AWS を利用可能 ◦ アカウント単位で Isolation が担保されるので、権限付与も容易
  13. マルチアカウント 2 / 2 • マルチテナント Amazon EKS や AWS

    Transit Gateway 等も独立アカウント ◦ インフラ関連のアカウントは Role 毎に細かくアカウントを分割 ◦ 各アカウントの責務最小化及び、将来的なアカウントオーナーの変更 にも耐えうる設計に
  14. マルチテナント Amazon EKS • サービスチームはサービス毎の Namespace 内のリソースを管理 ◦ 新規 Deployment

    / CronJob 等の追加や変更がサービスチーム内で完結 • インフラチームがクラスタを整備 & 運用 ◦ クラスタや各種コンポーネントのアップグレード 等を担当
  15. マルチアカウント / マルチテナント Amazon EKS におけるネットワーク問題 • マルチテナント Amazon EKS

    アカウントのアプリケーションはサービス別アカウン トの VPC リソース (e.g. RDS ) にアクセスできる必要がある • しかし、シングルアカウント内に Amazon EKS も VPC リソースもある状況のように 簡単にはアクセスができない
  16. マルチアカウント + マルチテナントAmazon EKS + AWS Transit Gateway • 全てのアカウントの

    VPC を AWS Transit Gateway を用いて接続 ◦ Amazon EKS クラスタとサービス別アカウントのリソースが通信可能に • VPC Peering に比べてアカウント数が増えても複雑化しない • VPC Sharing は将来的なシングルテナント化を見据えると分割の壁に 今後の組織及び事業の拡大と変化に 備えて AWS Transit Gateway を選択
  17. AWS Direct Connect • 密結合故に、あるサービスを AWS に移行したとしてもオンプレミス環境への接続 性を提供する必要がある ◦ 共有

    DB への接続が必要なアプリケーションも多々残っている • Direct Connect Gateway を利用して複数の AWS アカウントをオンプレミスと接 続 ◦ オンプレ側の事業者の制約により AWS Transit Gateway への接続は不可なため
  18. AWS ガバナンス • アカウント作成時に各種 Security Tools を完全自動でプロビジョニング ◦ CloudFormation Stack

    Sets + Step Functions • Service Control Policy によりメンバーア カウントでの操作を一部 Deny ◦ Security Tools に対する操作 ◦ リージョン制限 etc… • Cloud Trail はログ専用アカウントへ集約 ◦ 人間がログインできないように • Security Tools のマスターアカウントも独立
  19. Network ガバナンス 1 / 2 • マネーフォワードには本番環境を触るための VDI 環境が存在 ◦

    うっかり本番環境への他の経路が開いてしまうことは避けたい 各サービスアカウントに対して Internet Gateway の作成を (基本的に) Deny 本番環境へのアクセスは全て Bastion アカウント経由で行うことに
  20. Network ガバナンス 2 / 2 • 外部との通信ログも全て記録したい • 外向き通信の出口を Egress

    Gateway VPC に集約 ◦ アプリケーションや Bastion から外に行く通信は全て記録 ◦ セキュリティアプライアンスへの移行も可能な設計に
  21. 自由さとガバナンスの折衷案のアーキテクチャ • EKS クラスタは共通でも、サービスチームは Kubernetes 及び AWS を自由 に触ることができるアーキテクチャを実現 •

    但し、完全な自由ではなく制限された自由になっている ◦ ガバナンスのためにやってほしくないことはアーキテクチャで制限 セキュリティレベルを保つために制限を入れつつも最大限の自由を 自由さとガバナンスの折衷案をとったアーキテクチャを採用
  22. 開発フロー : 移行後 • 各サービスチームが PR を作成し、チーム内で Review & Merge

    ◦ インフラチームはリクエストされればレビューを実施 • AWS に対する変更は Terraform Cloud を用いて Terraform の Plan & Apply • Kubernetes に対する変更は ArgoCD を利用 ※記載されている会社名および商品・製品・サービス名(ロゴマーク等を含む)は、各社の商標または各権利者の登録商標です。 

  23. カルチャーを変えるためにどうするか • 徐々に慣れていってもらうことを目標に以下のようなことに取り組んでいる ◦ Amazon EKS へ移行したチームの島に常駐して質問しやすい環境作り ◦ 積極的なナレッジシェア。 Zoom

    等での社内 webinar を実施 ◦ 新規コンポーネント 等の追加やオペレーション時にはペア/モブプロ ▪ コストを払ってでもサービスチームを積極的に巻き込んでいく ◦ サービスチームからインフラチームへの留学プログラム ◦ 継続的なヒアリング ▪ 移行後に感じたペインを把握して、Platform の改善に活かす ◦ etc…. • 漸進的な Technical & Cultural Change を目指して色々と試行錯誤中
  24. まとめ • 組織と事業の拡大に立ち向かうため、マルチテナント Amazon EKS / マルチ アカウントアーキテクチャを採用 ◦ サービスチームにインフラを移譲し、スケールする組織を目指す

    • マルチテナント Amazon EKS で組織としての Technical Gap を最小限にしな がら、 サービスチーム毎の権限移譲は Namespace により確保 • マルチアカウントでサービスチームが AWS を自由に利用できるように • 開発プロセスの間にインフラチームが挟まらなくても良い仕組みに ◦ 実際に今後組織のカルチャーを変える努力をしながら、インフ ラチームが挟まらない状態を目指す