Upgrade to Pro — share decks privately, control downloads, hide ads and more …

dbt Cloudの新機能を紹介!データエンジニアリングの民主化:GUIで操作、SQLで管理す...

Avatar for Sagara Sagara
June 12, 2025

dbt Cloudの新機能を紹介!データエンジニアリングの民主化:GUIで操作、SQLで管理する新時代のdbt Cloud

2025/6/5に開催された「dbt Cloudの新機能を紹介!データエンジニアリングの民主化:GUIで操作、SQLで管理する新時代のdbt Cloud」の登壇資料です
https://events.classmethod.jp/seminar/250605-dbt-cloud-webinar/

Avatar for Sagara

Sagara

June 12, 2025
Tweet

More Decks by Sagara

Other Decks in Technology

Transcript

  1. ⾃⼰紹介 2 • 2020年9⽉ ⼊社 ◦ Modern Data Stackに該当する製品の 技術⽀援‧プリセールスを担当 ◦

    新しい技術情報を定期的に収集し、 ブログで情報発信 • 部署‧役割 ◦ Modern Data Stackチーム テックリード • 名前(ニックネーム) ◦ 相樂 悟 (さがら)
  2. ⽬次 3 • 昨今の「データ変換処理の開発」における問題 ◦ 「コードベースの開発」の問題 ◦ 「GUIベースの開発」の問題 • dbt

    Cloud概要 ◦ 概要&dbt Cloudにより解決できた問題 ◦ dbt Cloudにより解決できていない問題 • dbt Cloudの新機能「Canvas ※旧称:Visual Editor」 ◦ 機能紹介&Canvasにより解決できる問題 ◦ デモ • その他:dbt Cloud新機能紹介 • まとめ
  3. ⽬次 4 • 昨今の「データ変換処理の開発」における問題 ◦ 「コードベースの開発」の問題 ◦ 「GUIベースの開発」の問題 • dbt

    Cloud概要 ◦ 概要&dbt Cloudにより解決できた問題 ◦ dbt Cloudにより解決できていない問題 • dbt Cloudの新機能「Canvas ※旧称:Visual Editor」 ◦ 機能紹介&Canvasにより解決できる問題 ◦ デモ • その他:dbt Cloud新機能紹介 • まとめ
  4. 「データ変換処理の開発」コードベースの問題 その1 6 開発‧本番の切り分けにはGitのコマンドスキルが必要 • コードベースで開発‧本番を切り分けするには、Gitがほぼ必須 • Gitざっくり概要 ◦ ブランチという概念で「フォルダの中⾝」を 丸ごと切り出して、ブランチごとに変更履歴を

    保存し、いつでも保存時点に戻せる ◦ ブランチは、本番⽤ブランチ、 開発⽤ブランチ、と分けて使うことが多い • 右図は、開発⽤ブランチを切って開発し、 リモートリポジトリに反映するまでの⼀連の流れ
  5. 「データ変換処理の開発」コードベースの問題 その3 8 特にPythonの場合、⾼度なスキルが必要 • Pythonの開発環境の構築をどうするか? ◦ uv、poetry + pyenv、etc •

    Pythonの処理の実⾏基盤はどうするか? ◦ オンプレミス、AWS上の仮想マシン、AWS上のサーバーレスサービス、etc • 使⽤するライブラリはどうするか? ◦ Pandas、Spark、Polars、etc • エラーハンドリングをどうするか?
  6. ⽬次 9 • 昨今の「データ変換処理の開発」における問題 ◦ 「コードベースの開発」の問題 ◦ 「GUIベースの開発」の問題 • dbt

    Cloud概要 ◦ 概要&dbt Cloudにより解決できた問題 ◦ dbt Cloudにより解決できていない問題 • dbt Cloudの新機能「Canvas ※旧称:Visual Editor」 ◦ 機能紹介&Canvasにより解決できる問題 ◦ デモ • その他:dbt Cloud新機能紹介 • まとめ
  7. 「データ変換処理の開発」における問題 まとめ 14 • コードベースの問題 ◦ 開発‧本番の切り分けにはGitのコマンドスキルが必要 ◦ 処理の依存関係の構築‧管理が難しい ◦ 特にPythonの場合、⾼度なスキルが必要

    • GUIベースの問題 ◦ 開発内容のブラックボックス化 ◦ 開発‧本番の切り替えに対応しているツールがほぼない ◦ ツール固有の知識が付いて他の領域に活かしづらい
  8. ⽬次 15 • 昨今の「データ変換処理の開発」における問題 ◦ 「コードベースの開発」の問題 ◦ 「GUIベースの開発」の問題 • dbt

    Cloud概要 ◦ 概要&dbt Cloudにより解決できた問題 ◦ dbt Cloudにより解決できていない問題 • dbt Cloudの新機能「Canvas ※旧称:Visual Editor」 ◦ 機能紹介&Canvasにより解決できる問題 ◦ デモ • その他:dbt Cloud新機能紹介 • まとめ
  9. dbt Cloudにより解決できた問題:コードベースの問題 17 • コードベースの問題 ⇛ 解決! ◦ 開発‧本番の切り分けにはGitのコマンドスキルが必要 ◦ 処理の依存関係の構築‧管理が難しい ◦

    特にPythonの場合、⾼度なスキルが必要 • GUIベースの問題 ◦ 開発内容のブラックボックス化 ◦ 開発‧本番の切り替えに対応しているツールがほぼない ◦ ツール固有の知識が付いて他の領域に活かしづらい
  10. ⽬次 21 • 昨今の「データ変換処理の開発」における問題 ◦ 「コードベースの開発」の問題 ◦ 「GUIベースの開発」の問題 • dbt

    Cloud概要 ◦ 概要&dbt Cloudにより解決できた問題 ◦ dbt Cloudにより解決できていない問題 • dbt Cloudの新機能「Canvas ※旧称:Visual Editor」 ◦ 機能紹介&Canvasにより解決できる問題 ◦ デモ • その他:dbt Cloud新機能紹介 • まとめ
  11. dbt Cloudにより解決できていない問題:GUIベースの問題 22 • コードベースの問題 ◦ 開発‧本番の切り分けにはGitのコマンドスキルが必要 ◦ 処理の依存関係の構築‧管理が難しい ◦

    特にPythonの場合、⾼度なスキルが必要 • GUIベースの問題 ⇛ 未解決… ◦ 開発内容のブラックボックス化 ◦ 開発‧本番の切り替えに対応しているツールがほぼない ◦ ツール固有の知識が付いて他の領域に活かしづらい
  12. dbt Cloudにより解決できていない問題:GUIベースの問題 23 • コードベースの問題 ◦ 開発‧本番の切り分けにはGitのコマンドスキルが必要 ◦ 処理の依存関係の構築‧管理が難しい ◦

    特にPythonの場合、⾼度なスキルが必要 • GUIベースの問題 ⇛ 未解決… ◦ 開発内容のブラックボックス化 ◦ 開発‧本番の切り替えに対応しているツールがほぼない ◦ ツール固有の知識が付いて他の領域に活かしづらい 新機能:Canvasが解決します!
  13. ⽬次 24 • 昨今の「データ変換処理の開発」における問題 ◦ 「コードベースの開発」の問題 ◦ 「GUIベースの開発」の問題 • dbt

    Cloud概要 ◦ 概要&dbt Cloudにより解決できた問題 ◦ dbt Cloudにより解決できていない問題 • dbt Cloudの新機能「Canvas ※旧称:Visual Editor」 ◦ 機能紹介&Canvasにより解決できる問題 ◦ デモ • その他:dbt Cloud新機能紹介 • まとめ
  14. ⽬次 29 • 昨今の「データ変換処理の開発」における問題 ◦ 「コードベースの開発」の問題 ◦ 「GUIベースの開発」の問題 • dbt

    Cloud概要 ◦ 概要&dbt Cloudにより解決できた問題 ◦ dbt Cloudにより解決できていない問題 • dbt Cloudの新機能「Canvas ※旧称:Visual Editor」 ◦ 機能紹介&Canvasにより解決できる問題 ◦ デモ • その他:dbt Cloud新機能紹介 • まとめ
  15. ⽬次 32 • 昨今の「データ変換処理の開発」における問題 ◦ 「コードベースの開発」の問題 ◦ 「GUIベースの開発」の問題 • dbt

    Cloud概要 ◦ 概要&dbt Cloudにより解決できた問題 ◦ dbt Cloudにより解決できていない問題 • dbt Cloudの新機能「Canvas ※旧称:Visual Editor」 ◦ 機能紹介&Canvasにより解決できる問題 ◦ デモ • その他:dbt Cloud新機能紹介 • まとめ
  16. dbt Cloud新機能:新しいエンジン「dbt Fusion」 34 • dbtのバックエンドを担うエンジン部分を刷新し、 Rustで開発された「dbt Fusion」がリリース(現在はパブリックベータ) • 特徴

    ◦ 従来のdbt Coreよりも⾼速なSQL解析とコンパイル ◦ コンパイル後のSQLの検証は、DWHにクエリを発⾏せずにできるように ◦ (Cloudのみ)ジョブとして定期実⾏する際に、新しいレコードがあり  変更が必要なテーブルだけを⾃動で認識してビルドを⾏えるように • 今後提供予定の機能 ◦ 開発環境向けのエミュレータ ◦ PIIの⾃動分類 ◦ 複数DB/DWHに跨ったクエリ実⾏
  17. ⽬次 37 • 昨今の「データ変換処理の開発」における問題 ◦ 「コードベースの開発」の問題 ◦ 「GUIベースの開発」の問題 • dbt

    Cloud概要 ◦ 概要&dbt Cloudにより解決できた問題 ◦ dbt Cloudにより解決できていない問題 • dbt Cloudの新機能「Canvas ※旧称:Visual Editor」 ◦ 機能紹介&Canvasにより解決できる問題 ◦ デモ • その他:dbt Cloud新機能紹介 • まとめ