Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マルチプロダクトのデータ基盤設計 〜データメッシュを運用して見えた課題と伸びしろ〜

マルチプロダクトのデータ基盤設計 〜データメッシュを運用して見えた課題と伸びしろ〜

db tech showcase 2025 Tokyo

Avatar for Noriaki Hiraki

Noriaki Hiraki

July 10, 2025
Tweet

More Decks by Noriaki Hiraki

Other Decks in Technology

Transcript

  1. 3
 自己紹介 Findy / データエンジニア 開 功昂 / Noriaki Hiraki

    / @hiracky16 • 2023/11 にファインディの CTO 室データソリュー ションチームにジョイン 🙌 • マルチプロダクトデータ基盤を設計開発をリード • サッカー⚽とかポッドキャスト 🎙が好きです
  2. 13
 • 採用理由 ✅ ◦ 事業やチームごとにアクセス権を管理できる設計 ◦ データ蓄積や利活用の幅をより柔軟に広げられる • 懸念事項

    ⚠ ◦ 事業間の連携が遅くなる → ニーズがないので未考慮 ◦ データエンジニアが必要 → 採用頑張る💪 データメッシュへの移行理由と背景
  3. 23
 データ品質に対する取り組み # GitHub Actions name: validate-sql on: pull_request: branches:

    - main jobs: steps: - name: lint - name: coverage - name: dbt-build 
 – user_count_by_skill.sql select skill, count(1) from `project_a.dataset_b.users` where created_at >= '2025-01-01' push review review review
  4. 26
 データ可視化のセルフサービス化 select changed_date, count(1) from `project_a.dataset_b.user_job_logs` where changed_date >=

    '2025-01-01' explore: 転職分析 dim:change_month measure: count filter: change_date >= '2025-01-01' user_job_logs 
 user_job_histories 
 SELECT
 FROM ?
 logs or histories ?
 月次の転職数

  5. DMBOK で定義されるデータガバナンスの成果物(ドキュメント)を整備 データガバナンスに対する取り組み 
 30
 全社 事業A 事業B Architecture architecture.

    md architecture_ a.md architecture_ b.md Modeling modeling.md - - Security security.md security_a.md - Metadata metadata.md - - Storage storage.md - storage_b.md
  6. 31
 個人情報への取り組み Policy Tag を用いた動的マスキング DLP API を用いた個人データのマスキング select text, 

    `function.dlp`(text) as masked_text – マスキング処理をリモート関数で提供 from messages
  7. 36
 Don’t Repeat Yourself • インフラは Terraform Private Module で共通化

    • データは Analytics Hub で共通化することで SSoT を実現 • 共通化は工数削減やガバナンスの統一に効果がある