Upgrade to Pro — share decks privately, control downloads, hide ads and more …

クラウドネイティブな新しいネットワークコントローラをつくる

 クラウドネイティブな新しいネットワークコントローラをつくる

Hiroki Okui

October 28, 2022
Tweet

More Decks by Hiroki Okui

Other Decks in Technology

Transcript

  1. © NTT Communications Corporation All Rights Reserved. 自己紹介 NTTコミュニケーションズ Software

    Engineer 奥井 寛樹 略歴 • 伝送ネットワーク 設定自動化システム開発 • DevOpsプラットフォーム開発 • IoTデータ収集基盤 モダナイゼーション @HirokiOkui hrk091 2
  2. © NTT Communications Corporation All Rights Reserved. 前置き ネットワークコントローラと •

    サービス・NW仕様に基づいて、APIリクエストからコンフィグを導出し装置に設定するも 以下 スコープ外 • SDNによるコントロールプレーン • 構成管理機能(連携先として考慮) • システム間連携をするワークフロー機能 • 監視機能(現時点 。いずれ 考えたい) • ZTP(装置へ Reachabilityが確保されている前提) 3
  3. © NTT Communications Corporation All Rights Reserved. 4 本発表 構成

    1. ネットワークコントローラ開発 現状と課題 2. クラウドネイティブ技術 紹介 3. クラウドネイティブ技術を用いてつくってみた
  4. © NTT Communications Corporation All Rights Reserved. オーケストレータと組み合わせてon-demandサービス化 • 装置ベンダEMS

    or 装置自体がREST APIを開けているケースが増え、自動化しやすくなった • Ansibleを用いた自動化事例が増え、 Pythonライブラリなども充実 API連携で 自動化 ワークフロー基盤 or APIオーケストレータ NWコントローラ User Ops 3rd-Party 7 - サービスオーダー - 装置コンフィグ キャッシュ - etc…
  5. © NTT Communications Corporation All Rights Reserved. 自動化 課題 NWコントローラ

    User Ops Ansibleなどが整備されている場 合は良いが、ユーザが少ない装 置は結局ほぼスクラッチ開発 (伝送装置など) スクラッチ開発をすると手続き 的なスクリプトになり、Jinja2 でテンプレートマッピングして SSHで投げるだけになる 装置に設定されたconfigが、 実機を見ないとわからない 8 ワークフロー基盤 or APIオーケストレータ 構成ドリフト*1が発生する - サービス仕様・実装の変更 - 実機への手動設定変更 *1: NWコントローラで導出したコンフィグと、実機に入っているコンフィグに差異があること 3rd-Party
  6. © NTT Communications Corporation All Rights Reserved. Gitでコンフィグ管理し、CIでテストし、PR mergeトリガでデリバリ •

    Netboxから構成情報を取得しつつ、 Ansibleでデリバリ GitOps 例 Github NWコントローラ Ops Admin Approve PR merge CI PR 9
  7. © NTT Communications Corporation All Rights Reserved. GitOps 課題 Github

    NWコントローラ Ops Admin Approve PR merge CI PR reviewでCIの結果を見て判断しているが、CIで確認 したコンフィグが必ずしも装置に入るとは限らない - 外部(Netboxなど) に依存している - CIで検証した版と実環境で動いている版が異なる Push型であり、装置のシークレットがここに 集約される。セキュリティリスクが高い モデル・スキーマ情報がなく、ゴールデンファイ ルとの差分確認テストしか出来ない。 検証は全てReviewerの目視確認に委ねられる。 外部(Netboxなど)に依存しており、Gitで過去の 版に戻しても同じconfigを必ずしも再現できない PR 10
  8. © NTT Communications Corporation All Rights Reserved. クラウドネイティブなCI/CD 技術・プラクティス (ネットワークコントローラ開発に役立つも

    を抜粋) 12 Infrastructure as Code Reconciliation Loop GitOps Secret管理 構成テスト IaC プログラマビリティ CUE言語 台頭 まだ普及していませんが、 今回の開発の重要なコンポーネントなので紹介
  9. © NTT Communications Corporation All Rights Reserved. Infrastructure as Code(aka

    IaC) インフラをコードで記述し、ソフトウェア開発 プラクティスを活かす • 多く ツールが生み出され、大多数 企業が採用している • Terraform、Cloud Formation、Kubernetes YAML、etc… ただツールを使ったり、宣言的コードで表現すれ よいわけで ない • 自動テスト、CI/CD、シフトレフト、モニタリング、高速なリリースサイクル ... 13 IaCを効率的に使う システム・プロセス・慣習が大事
  10. © NTT Communications Corporation All Rights Reserved. 宣言状態に収束させるReconciliation Loop IaCで宣言された状態に収束させるに

    、実行エンジンが必要 • 非常駐型:Terraformなど IaCツール全般 • 常駐型:Kubernetes Reconciliation Loop ← 昨今 トレンド k8s Reconciliation Loop • 観測されたインフラ状態と宣言状態が一致するまで、 デプロイ処理を繰り返す k8s 仕組み • k8s リソース 全てこ 仕組みで制御される k8sカスタムオペレータ • k8s上で、ユーザが独自 定義を持ち込み、 任意 リソースをIaCとして管理するk8s拡張方式 • CNCF 多く OSS 、k8sカスタムオペレータとして実装 14 今回の開発でも使用しています
  11. © NTT Communications Corporation All Rights Reserved. pull GitOps Gitで構成管理をして、PR

    mergeをトリガとしてデプロイする手法 • 2017年にWeaveworks CEOによって提唱された概念 *1 • Single Source of Truth(SSoT)が重要で、Pull型が選択される • ArgoCD、FluxCDなど GitOps メリット • Single Source of Truth(SSoT)であり外部依存がなく、 Git Version指定だけで任意 状態を再現可 • Pull型 ため、構成・運用 両面で Secretを秘匿しやすい *1: https://www.weave.works/blog/gitops-operations-by-pull-request CIOps push hook deploy GitOps push deploy 15 今回の開発で 使用しています インフラにデリバリするコンフィグが 一箇所に集約されている状態
  12. © NTT Communications Corporation All Rights Reserved. Secret管理、構成テスト Secret管理:IaCで 大きな懸念事項

    • Secretをmanifestに書かないことで、漏洩リスクなく GitOpsしたい • パブリッククラウド シークレットマネージャーを使う が今 主流 • External Secrets Operator、Secrets Store CSI Driver など 構成テスト:IaCマニフェスト テスト • リリースする前に、CIでマニフェスト 正しさを検証する • OPA conftest、Kyverno、Kubewardenなど ネットワークコンフィグのプロビジョニングでも 取り入れたいプラクティスです 16
  13. © NTT Communications Corporation All Rights Reserved. IaC プログラマビリティ 宣言的マニフェストを効率的に記述するために高度なアプローチが生まれている

    • Terraform系:Pulumi、CDK(JSなど汎用言語で書ける) • k8s系:Helm、kustomize(Helm chartやkustomizationによるモジュール化) モジュール化するだけでなく、透明性と拡張性が重要 • Overlay(マニフェスト 任意 拡張・変更)機能を各ツールサポート • 内部を隠蔽せず、透明性を維持する kind: Deployment spec: template: spec: containers: - name: test image: say-hello ... image: say-hello:v1.1.0 env: - name: TARGET vaule: world + ... spec: template: spec: containers: - name: test image: say-hello:v1.1.0 env: - name: TARGET value: world = Overlay 例 base patch base + patch 17 抽象化による内部の隠蔽・関心の分離が重要な 通常のソフトウェア開発とはアプローチが異なります
  14. © NTT Communications Corporation All Rights Reserved. CUE言語 台頭 2018年に登場したデータ記述言語

    • Marcel van Lohuizenが GCL*1で 経験を元に作成 • 国内で 、メルカリが使っていることで有名 • CUEを用いた新しいサービスや OSSなどが昨年から出てきている *2 特徴 • better JSONとしてライトに使える • データ 中にロジックを書ける(チューリング完全) • モジュール化など、ソフトウェア開発 プラクティスが適用可 • 型と値と制約を同一 も として扱う型システム • 交換法則と結合法則が成り立ち、 結合順序・階層によらない 任意 Overlay(Composite)が可能 • 構成テストもできる 18 // Value Alice: age: 20 // Type People: age: int // Constraint Member: age: > 18 // Validate Alice & People & Member *1: Google/Borg 中で使われているデータ記述言語 *2: dagger.io, KubeVelaなど 今回の開発で使用しています 型と値と制約を同様に扱う ネットワークコントローラ開発 で重要な特性です
  15. © NTT Communications Corporation All Rights Reserved. 現代的なCDパイプライン Manifest Repo

    k8s Reconciliation Loop Ops Admin Approve PR merge Test Admission Webhook Source Repo Pull PR 19
  16. © NTT Communications Corporation All Rights Reserved. これから来るCDパイプライン(?) Manifest Repo

    k8s Reconciliation Loop Ops Admin Approve PR merge Test Admission Webhook Source Repo Pull PR 20 CUEが流行ると、マニフェスト生成・構成テストで CUEを使うことが一般的になるかもしれません
  17. © NTT Communications Corporation All Rights Reserved. ネットワークプロビジョニングと 比較 Manifest

    Repo k8s Reconciliation Loop Ops Admin Approve PR merge Test Admission Webhook Source Repo Pull Github NWコントローラ Ops Admin Approve PR merge CI PR PR Push 21
  18. © NTT Communications Corporation All Rights Reserved. Push PR PR

    ネットワークプロビジョニング 遅れている Manifest Repo k8s Reconciliation Loop Ops Admin Approve PR merge Test Admission Webhook Source Repo Pull Github NWコントローラ Ops Admin Approve PR merge CI モデル・スキーマ情報がない。 ゴールデンファイルとの差分確 認のテストしか出来ない SSoTになっておらず、Git操作だ けでは過去の状態への切り戻し ができない 手続き的なスクリプト & モデリ ングが不十分。バグが混入した り構成ドリフトが起こりやすい 装置のシークレットが一箇所に 集まり、セキュリティリスクが あがる 22
  19. © NTT Communications Corporation All Rights Reserved. 要件 ネットワークコンフィグを、テキストで なくモデルで扱う能力

    • ドメイン駆動・オブジェクト指向で開発できるプログラマビリティ • 型・スキーマに基づいたバリデーション・構成テスト、 Overlayによる拡張機能 • そ ために 、型付きドキュメントツリー 合成能力が必要 GitOps 実践 • SSoT 徹底 • Pull型で、シークレット 漏洩リスクを減らす そもそも、ネットワークコントローラとしてほしいも • マルチデバイス 分散トランザクション • マルチベンダー・マルチバージョン対応 • 外部システムと API連携 ため Northbound Interface 自動生成 24
  20. © NTT Communications Corporation All Rights Reserved. 要件 ネットワークコンフィグを、テキストで なくモデルで扱う能力

    • ドメイン駆動・オブジェクト指向で開発できるプログラマビリティ • 型・スキーマに基づいたバリデーション・構成テスト、 Overlayによる拡張機能 • そ ために 、型付きドキュメントツリー 合成能力 が必要 GitOps 実践 • SSoT 徹底 • Pull型で、シークレット 漏洩リスクを減らす そもそも、ネットワークコントローラとしてほしいも • マルチデバイス 分散トランザクション • マルチベンダー・マルチバージョン対応 • 外部システムと API連携 ため Northbound Interface 自動生成 出番! 25
  21. © NTT Communications Corporation All Rights Reserved. 設計 k8s Reconciliation

    Loop Ops Admin Approve PR merge Test Pull gNMI API Server Map Reduce Eval Composite Northbound Model Southbound Model Source Controller Device Rollout CR DeviceA Operator DeviceA Operator DeviceA CR DeviceA Operator DeviceA Operator DeviceB CR SSoT Multi-vendor Multi-version Devices DeviceA Operator DeviceA Operator DeviceA Subscriber DeviceA Operator DeviceA Operator DeviceB Subscriber Provision Change Notification 26
  22. © NTT Communications Corporation All Rights Reserved. 設計 k8s Reconciliation

    Loop Ops Admin Approve PR merge Test Pull gNMI API Server Map Reduce Eval Composite Northbound Model Southbound Model Source Controller Device Rollout CR DeviceA Operator DeviceA Operator DeviceA CR DeviceA Operator DeviceA Operator DeviceB CR SSoT Multi-vendor Multi-version Devices DeviceA Operator DeviceA Operator DeviceA Subscriber DeviceA Operator DeviceA Operator DeviceB Subscriber Provision Change Notification 27 - 上位ドメインモデルから装置コンフィグへのマッピングを CUEで簡単に記述できる - CUEによる型バリデーションとポリシーエンフォースメント - ドメイン駆動な開発ができる
  23. © NTT Communications Corporation All Rights Reserved. 設計 k8s Reconciliation

    Loop Ops Admin Approve PR merge Test Pull gNMI API Server Map Reduce Eval Composite Northbound Model Southbound Model Source Controller Device Rollout CR DeviceA Operator DeviceA Operator DeviceA CR DeviceA Operator DeviceA Operator DeviceB CR SSoT Multi-vendor Multi-version Devices DeviceA Operator DeviceA Operator DeviceA Subscriber DeviceA Operator DeviceA Operator DeviceB Subscriber Provision Change Notification 28 - SSoTを実現 - GitのRevision指定だけで任意の状態に切り戻せる - Gitを見れば、実際に装置に入っているConfigがわかる - 実際のコンフィグを用いて、CIのテストを回せる - 機械的な判定を自動化して、Reviewの負担を軽減
  24. © NTT Communications Corporation All Rights Reserved. 設計 k8s Reconciliation

    Loop Ops Admin Approve PR merge Test Pull gNMI API Server Map Reduce Eval Composite Northbound Model Southbound Model Source Controller Device Rollout CR DeviceA Operator DeviceA Operator DeviceA CR DeviceA Operator DeviceA Operator DeviceB CR SSoT Multi-vendor Multi-version Devices DeviceA Operator DeviceA Operator DeviceA Subscriber DeviceA Operator DeviceA Operator DeviceB Subscriber Provision Change Notification Gitの更新をPollingして、変更を契機にデリバリ 29 Device Rolloutで分散トランザクションを管理し、 デリバリに失敗したら全体を前の状態に戻す マルチベンダー・マルチバージョンのデバイスでも、 k8sカスタムオペレーターを実装すれば対応可能
  25. © NTT Communications Corporation All Rights Reserved. 設計 k8s Reconciliation

    Loop Ops Admin Approve PR merge Test Pull gNMI API Server Map Reduce Eval Composite Northbound Model Southbound Model Source Controller Device Rollout CR DeviceA Operator DeviceA Operator DeviceA CR DeviceA Operator DeviceA Operator DeviceB CR SSoT Multi-vendor Multi-version Devices DeviceA Operator DeviceA Operator DeviceA Subscriber DeviceA Operator DeviceA Operator DeviceB Subscriber Provision Change Notification - 装置のシークレットがk8s Secret Resourceとして管理される - External Secrets Operator、クラウドプロバイダーのCSI Driver などを使えば、先端のシークレット管理プラクティスに従って安 全に管理できる 30
  26. © NTT Communications Corporation All Rights Reserved. 設計 k8s Reconciliation

    Loop Ops Admin Approve PR merge Test Pull gNMI API Server Map Reduce Eval Composite Northbound Model Southbound Model Source Controller Device Rollout CR DeviceA Operator DeviceA Operator DeviceA CR DeviceA Operator DeviceA Operator DeviceB CR SSoT Multi-vendor Multi-version Devices DeviceA Operator DeviceA Operator DeviceA Subscriber DeviceA Operator DeviceA Operator DeviceB Subscriber Provision Change Notification 31
  27. © NTT Communications Corporation All Rights Reserved. ドライバ実装 どうする? k8s

    Reconciliation Loop Ops Admin Approve PR merge Test Pull gNMI API Server Map Reduce Eval Composite Northbound Model Southbound Model Source Controller Device Rollout CR DeviceA Operator DeviceA Operator DeviceA CR SSoT OpenConfig Devices DeviceA Operator DeviceA Operator DeviceA Subscriber gNMI gNMI Subscribe 32
  28. © NTT Communications Corporation All Rights Reserved. ドライバ実装 ➞ OpenConfigを活用

    k8s Reconciliation Loop Ops Admin Approve PR merge Test Pull gNMI API Server Map Reduce Eval Composite Northbound Model Southbound Model Source Controller Device Rollout CR DeviceA Operator DeviceA Operator DeviceA CR SSoT OpenConfig Devices DeviceA Operator DeviceA Operator DeviceA Subscriber gNMI gNMI Subscribe OpenConfig YANG Go Struct CUE type def ygot generator cue get 33
  29. © NTT Communications Corporation All Rights Reserved. ほしいも できた か?

    ネットワークコンフィグを、テキストで なくモデルで扱う能力 • CUEで実現できた • (CUEを記述する必要があり、敷居があがっている問題がある) GitOps 実践 • Flux CD Source-Controllerで簡易にできた • k8s Secret関連 プラクティスや最小権限 原則を活かせる そもそも、ネットワークコントローラとしてほしいも • マルチデバイス 分散トランザクション => k8s カスタムオペレータで実現 • マルチベンダー・マルチバージョン対応 => k8s カスタムオペレータで実現 • 外部システムと API連携 ため Northbound Interface 自動生成 => gNMIで実現 34
  30. © NTT Communications Corporation All Rights Reserved. 35 まとめと今後 予定

    クラウドネイティブ技術を用いたネットワークコントローラを開発した • OpenConfig/gNMI emulator対向で 動作確認済 実機結合検証中 • 伝送:OpenConfig/gNMIを具備する伝送Whiteboxと フィールドトライアル • 転送:予定なし(検証ユースケース・検証パートナー募集中) OSS化を目指して社内調整中 • 早けれ 12月頃予定 • UX改善、パフォーマンス改善、ハーデニングなど推進中