Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
dbtで作るデータ分析基盤
Search
RyutoYoda
February 11, 2025
0
15
dbtで作るデータ分析基盤
RyutoYoda
February 11, 2025
Tweet
Share
More Decks by RyutoYoda
See All by RyutoYoda
databricks,dbt,AWS S3を使ったデータパイプラインレシピ
ryutoyoda
0
44
Google Cloud Professional Data Engineer 合格に向けて
ryutoyoda
0
61
AWS Supply Chainの調査
ryutoyoda
0
27
EmoEcho
ryutoyoda
0
43
Featured
See All Featured
Fireside Chat
paigeccino
37
3.5k
A better future with KSS
kneath
239
17k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
20k
Code Review Best Practice
trishagee
68
18k
Art, The Web, and Tiny UX
lynnandtonic
299
21k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
The Cost Of JavaScript in 2023
addyosmani
50
8.4k
For a Future-Friendly Web
brad_frost
179
9.8k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.7k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
48
2.8k
Practical Orchestrator
shlominoach
188
11k
Transcript
dbtで作るデータ分析基盤 Ryuto Yoda 2025年2月14日
・データ活用の課題 ・dbtとは? ・dbtの魅力 ・dbtの課題 ・質問タイム おしながき
・データ活用の課題 ・dbtとは? ・dbtの魅力 ・dbtの課題 ・質問タイム おしながき
データ活用の課題 データ分析したい! AIを作りたい!
データ活用の課題 使える綺麗なデータがない、、、
データ活用の課題 データ分析やAIモデル開発には「綺麗なデータ」が必要。 でも、現実は違います。 複数のファイルやテーブルがごちゃごちゃ 名前の揃わないカラムや欠損値だらけのデータ ビジネスで利用できる形式になっていない このカオスを整理するためのツールがdbtです!
・データ活用の課題 ・dbtとは? ・dbtの魅力 ・dbtの課題 ・質問タイム おしながき
主にSQLで書ける「データ変換ツール」data build toolの頭文字をとって「dbt」 データベースのクエリエンジンに依存せず、自由 度が高い(PostgreSQL、BigQuery、Snowflake など対応) 類似サービス(dataform) エンジニアと分析担当の架け橋になるツールです! dbtとは?
dbtとは? データアーキテクチャにおけるdbtの立ち位置
・データ活用の課題 ・dbtとは? ・dbtの魅力 ・dbtの課題 ・質問タイム おしながき
dbtの魅力 冪等性が高く同じ処理を何度実行しても結果 が変わらない安心感 ビジネスロジックを組み込んだデータ開発が 可能
冪等性について dbtでは依存関係を明確に管理する設計が組み込ま れており、コードで入力と出力を明確に定義する ことができます。 入力元テーブル 出力先テーブル
ビジネスロジックを組み込んだデータ開発 dbtではディメンショナルモデルング(データをビジネス 分析しやすくするために切り出す手法)を簡単に組み込 む関数が充実しています。
dbtデモ 実際に動かしてみます!
・データ活用の課題 ・dbtとは? ・dbtの魅力 ・dbtの課題 ・質問タイム おしながき
dbtの課題 dbtはSQLベースで簡単に開発を進めることができますが、 ビジネス特性の理解やデータモデリングに関する知識がなけ ればデータカオスは解消されず、dbtの機能を十分に活かす ことは難しくなります
dbtの課題 そこでdbtを使ったモデリングに 関するおすすめ資料をまとめてみました。 kimball-dimensional-model dbt_data_vault ・ディメンショナルモデリングの実践 ・データボルト2.0の実践
これで完全に理解...
質問タイム