Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
dbtでGA4の生ログを扱いやすくする話
Search
Hirokazu Kobayashi
February 16, 2023
Technology
2
1.8k
dbtでGA4の生ログを扱いやすくする話
2023-02-16に開催したJagu'e'r分科会でのLT発表スライドです
Hirokazu Kobayashi
February 16, 2023
Tweet
Share
More Decks by Hirokazu Kobayashi
See All by Hirokazu Kobayashi
dbtでアトリビューション分析
hiro_koba_jp
0
1.6k
Data Engineering Study #16 LT troccoデータカタログ
hiro_koba_jp
0
320
trocco Summer Update 2022 - 「dbt連携/グループ機能リニューアル」他ご紹介
hiro_koba_jp
0
430
DES#13 troccoデータカタログ&PdM募集
hiro_koba_jp
0
170
データマネジメントを実現するためのサービス・OSSまとめ
hiro_koba_jp
0
650
広告・マーケROIを可視化するためにETL/データ整備した話
hiro_koba_jp
0
1.8k
AWS ETL祭り - AWS Glue活用事例@primeNumber
hiro_koba_jp
6
6.4k
Other Decks in Technology
See All in Technology
情シスのための生成AI実践ガイド2026 / Generative AI Practical Guide for Business Technology 2026
glidenote
0
270
Kiro Powers 入門
k_adachi_01
0
110
AI時代の「本当の」ハイブリッドクラウド — エージェントが実現した、あの頃の夢
ebibibi
0
140
JAWSDAYS2026_A-6_現場SEが語る 回せるセキュリティ運用~設計で可視化、AIで加速する「楽に回る」運用設計のコツ~
shoki_hata
0
3k
SRE NEXT 2026 CfP レビュアーが語る聞きたくなるプロポーザルとは?
yutakawasaki0911
1
400
銀行の内製開発にて2つのプロダクトを1つのチームでスクラムしてみてる話
koba1210
1
140
ガバメントクラウドにおけるAWSの長期継続割引について
takeda_h
2
5.1k
Postman v12 で変わる API開発ワークフロー (Postman v12 アップデート) / New API development workflow with Postman v12
yokawasa
0
140
2026年もソフトウェアサプライチェーンのリスクに立ち向かうために / Product Security Square #3
flatt_security
1
630
Oracle Cloud Infrastructure IaaS 新機能アップデート 2025/12 - 2026/2
oracle4engineer
PRO
0
160
The_Evolution_of_Bits_AI_SRE.pdf
nulabinc
PRO
0
230
スケールアップ企業でQA組織が機能し続けるための組織設計と仕組み〜ボトムアップとトップダウンを両輪としたアプローチ〜
tarappo
1
110
Featured
See All Featured
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.7k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
The Invisible Side of Design
smashingmag
302
51k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
160
A Tale of Four Properties
chriscoyier
163
24k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
240
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
64
53k
Mobile First: as difficult as doing things right
swwweet
225
10k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Building Adaptive Systems
keathley
44
3k
Transcript
GA4 x dbt Jagu'e'r LT 2023/02 GA4の生ログの弱点と、それを補うdbtパッケージを試してみ た
小林 寛和 株式会社primeNumber 取締役執行役員 CPO hiro_koba_jp 慶應義塾大学卒業後、2014年より株式会社リブセンス へ入社し、データエンジニアとして同社分析基盤 立ち上げをリード。 trocco®のプロダクト発案者で、現プロダクト責任者。
Data Engineering Studyの共同主催者も務める。
Agenda GA4の生ログの概要と、課題 1 dbtでGA4の生ログをより使いやすく 2 まとめ 3
GA4の生ログの概要と、課題
GA4のさまざまな使い方 Google AnalyticsのブラウザUIから見る Looker Studioとかでつないで可視化する GA4のBigQuery Exportを使い、生ログからデータ分析 ©2023 primeNumber Inc.
All Rights Reserved. Confidential. 5
GA4のさまざまな使い方 Google AnalyticsのブラウザUIから見る Looker Studioとかでつないで可視化する GA4のBigQuery Exportを使い、生ログからデータ分析 ©2023 primeNumber Inc.
All Rights Reserved. Confidential. 6
GA4の生ログの弱点 データ構造が扱いにくい event_timestampがUNIXTIMEなので変換が必要 ログがいつ来るのか分からない・タイムラグがある ©2023 primeNumber Inc. All Rights Reserved.
Confidential. 7
データ構造が扱いにくい
集計しようとすると・・・
GA4の生ログを使いやすくするために、 dbtというツールを使ってみた
先程の弱点を解決するには ひたすらクエリで頑張る 1 扱いやすい形に整形してから使う 2 ©2023 primeNumber Inc. All Rights
Reserved. Confidential. 11
先程の弱点を解決するには ひたすらクエリで頑張る 1 扱いやすい形に整形してから使う 2 ©2023 primeNumber Inc. All Rights
Reserved. Confidential. 12
データウェアハウス層を作っ て 扱いやすくしたい もう少し専門用語でいうと ©2023 primeNumber Inc. All Rights Reserved.
Confidential. 13
GA4のスキーマなんて全世界共通なんだし、 誰かがいい感じの作ってくれてるんじゃない の?
dbt-ga4なるものが!!!
とりあえず使ってみ た
導入手順 dbtのプロジェクトを作る packages.ymlにdbt-ga4パッケージを追加 dbt_project.ymlでご自身のGA4の設定を記載 dbt deps実行 dbt build実行 1 2
3 4 5 ©2023 primeNumber Inc. All Rights Reserved. Confidential. 17
めちゃくちゃ楽
成果物を、もう少し詳し く
全体像 BigQuery Export GA4 BigQuery生ログテーブル (データレイク層) 整形後のテーブル (データウェアハウス 層) dbt-ga4
©2023 primeNumber Inc. All Rights Reserved. Confidential. 20
None
None
スタースキーマっぽくなってる dim_sessions dim_users fct_session fct_pages ©2023 primeNumber Inc. All Rights
Reserved. Confidential. 23
None
None
None
できればこうして欲しかった 1行がページビュー単位など、イベント別にテ ーブルを用意する dim_sessionに情報もたせ過ぎない パーティショニング対応 タイムラグ問題は解決していない・・・ 探索的な分析をする最小粒度なので デバイスや国・地域などもディメンションテーブル化 ©2023 primeNumber
Inc. All Rights Reserved. Confidential. 27
最後に宣伝を・・・
None
trocco「Web行動ログ収集SDK」 Web分析に必要なデータを取得 1タグでPV、イベント、メール開封ログなどが収集可能 GAと同じデータが生ログで、任意のDWHに蓄積 セッションやチャネルの定義はGAを踏襲 お好きなDWH(BigQuery/Redshift)に10分以内に転送 BigQueryのパーティショニングにも各種対応 広告アトリビューション分析が可能 重複のない、正確なコンバージョン数の集計に必要な アトリビューション分析が行なえます。
広告アトリビューション分析の詳細は担当営業まで お問い合わせ下さい ©2023 primeNumber Inc. All Rights Reserved. Confidential. 30
この辺の話に興味ある方、つながってくださ い! (DMもウェルカムです) Twitter: @hiro_koba_jp ©2023 primeNumber Inc. All Rights
Reserved. Confidential. 31
ご清聴ありがとうございました