Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マイベストのシンプルなデータ基盤の話 - Googleスイートとのつき合い方 / mybest...

Avatar for snhryt snhryt
October 24, 2025

マイベストのシンプルなデータ基盤の話 - Googleスイートとのつき合い方 / mybest-simple-data-architecture-google-nized

複雑さに呑まれないデータ基盤:規模・コスト・運用で見極める“ちょうど良い”設計 (Findy Tools)

https://findy-tools.connpass.com/event/370964/

Avatar for snhryt

snhryt

October 24, 2025
Tweet

More Decks by snhryt

Other Decks in Programming

Transcript

  1. • 2021年頃に立ち上がったアーキテクチャをベースにしている ◦ 当時はまだSnowflakeやDatabricksがそこまで台頭しておらず、 DWHの選択肢としてはBigQueryがデファクトだった • 2024年まで、社内にデータ基盤専任の人材が不在。 データ基盤は当時のCTOが「未来への投資」として片手間で構築・運用 • 運用にかけられるリソースが限定的だったからこそ、コストは慎重に吟味

    ◦ Dataform選定の決め手もそのあたりにある • 2024年10月にデータエンジニア(私)が入社して手をつけてきたのは 大枠のアーキテクチャというより、DWH内のテーブルの改修・拡張 「こうあるべきだからこのツール!」といったニーズベースの組み立てではなく、様々な歴史的経緯を経て今の形に着地 アーキテクチャの選定理由はどちらかというと制約ベース 9 https://note.com/miraoto/n/n9feee6d6cb22
  2. • Googleサービス群との相性がいい • なんやかんやのコストメリット • 老舗DWHならではの豊富なナレッジ • Google Cloudの進化(特にAI文脈)にあやかれる DWHをSnowflakeにする、Databricksにする、Transformationをdbtにする、BIをLookerにする、Evidenceにする等

    現在は他にもいろいろ選択肢がある中で、改めてこのアーキテクチャを採用し続けることに意味を与えてみる 現アーキテクチャを肯定しよう 11 今日はこれらをメインで話します
  3. 1コンテンツにこれだけのデータが紐づく 17 検索 (SEO) ログ ・対策キーワードの順位 ・検索CTR etc. サービスDB ・商品情報

    ・順位、検証スコア etc. ユーザーログ ・セッション ・クリック、CTR ・読了 etc. コンバージョンログ 主要3EC + ASPそれぞれで ・コンバージョン数、CVR ・売上 etc. 広告出稿状況 ・Adsense or 企業広告 ・広告収益 etc. その他 ・各種予算 ・社内管理用メタデータ ・関連YouTube動画 etc.
  4. スプレッドシート ×BigQueryの強み • いったんスプレッドシートにデータを持ってきた後に、無限の柔軟性で任意の集計・見せ方ができる ◦ それってアンチパターン寄りでは? → Yes. But, 綺麗事だけじゃ通用しない世界がある

    ◦ いろいろ囁かれながらも、未だにExcel・スプシが廃れないのにはそれなりの理由(= 優れたUX)がある ◦ なんやかんやで、非エンジニアが最も習熟しているツールはExcel・スプシであることも多い • データの部分的な編集が可能 ◦ テーブル本体の値をガイドラインとして、値を部分的に編集してシミュレーションしたりできる ▪ 直接テーブルデータを上書きするわけではないので、データ破壊のリスクがない ◦ e.g. 予算策定時の利用 こういったことが、ネイティブの機能で実現できる点は、十分に BigQueryの強力な優位性と言えるだろう スプシは単なるツールじゃない。インフラだ 25
  5. • BigQuery Studio、スプレッドシート、 Looker Studio すべての利用状況を BigQueryの INFORMATION_SCHEMA からユーザー単位でトラッキング可能 ◦

    金食い虫になっている野良のスプシ、Looker Studioなども検出可能 ◦ (細かい話として、スプシのURLのみ audit_log の接続が必要) • Google Analytics, Google Tag Manager, Google Search Console, YouTube等とのデータ連携がスムーズ • Looker Studioで、BigQueryと接続したときにしか使えない機能がある ◦ BI Engine ◦ BigQueryにエクスポートされたGoogle Analyticsテーブルの指標自動作成 その他Googleサービス群との相性のよさ 26
  6. Dataform, Looker Studioが無償なおかげで、データ基盤トータルのランニングコストは比較的抑えられている(はず) 無償万歳 30 Extract & Load DWH Transformation

    BI マイベストの構成 💰 TROCCO / Cloud Functions 💰 BigQuery Dataform Looker Studio / スプレッドシート よく見る構成 💰 Fivetran 💰 Snowflake 💰 dbt (Cloud or Core) 💰Looker
  7. • Googleサービス群との相性がいい ◦ スプシとのネイティブ連携は BigQueryの強み • なんやかんやのコストメリット ◦ DataformはBigQuery利用者の福利厚生 •

    老舗DWHならではの豊富なナレッジ • Google Cloudの進化(特にAI文脈)にあやかれる まとめ: 現在のアーキテクチャの採用理由(後付け) 33