Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
事業拡大と共に歩むプラットフォームへの道 Google Cloudによる拡張可能なデータ基盤
Search
Keisuke Tagashira
February 25, 2026
0
58
事業拡大と共に歩むプラットフォームへの道 Google Cloudによる拡張可能なデータ基盤
Keisuke Tagashira
February 25, 2026
Tweet
Share
More Decks by Keisuke Tagashira
See All by Keisuke Tagashira
ADKを活用して事業部横断の企業検索エージェントを作成した話
ktagashira
3
1.3k
Findyのユーザーサクセス面談を支えるデータ技術
ktagashira
1
810
Featured
See All Featured
The Mindset for Success: Future Career Progression
greggifford
PRO
0
280
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
280
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
GraphQLの誤解/rethinking-graphql
sonatard
75
11k
Mind Mapping
helmedeiros
PRO
1
120
Making Projects Easy
brettharned
120
6.6k
GitHub's CSS Performance
jonrohan
1032
470k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
150
Git: the NoSQL Database
bkeepers
PRO
432
66k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
200
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
170
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
Transcript
事業拡大と共に歩むプラットフォームへの道 Google Cloudによる拡張可能なデータ基盤 Google Cloud Community Tech Surge 2026 ファインディ株式会社
CTO 室データソリューションチーム / データエンジニア 田頭 啓介(tagasyksk)
自己紹介
田頭啓介 / @tagasyksk ファインディ株式会社 / データエンジニア 2024年5月〜 CTO 室データソリューションチームにジョイン マルチプロダクトのデータ基盤の開発に従事
自己紹介
None
None
📖 これまでのデータ基盤のあゆみ データメッシュを採用した分散型アーキテクチャの運用 ⚠️ 事業拡大で直面した課題 プロダクト急増によるサイロ化と管理コストの増大 🔧 どう解決したか プロジェクト統合と共通化・分権のバランス再設計 🚀
今後の展望 AI Agent Readyなデータ基盤へ 本日の内容
これまでのデータ基盤のあゆみ
分散型のデータウェアハウスのアーキテクチャ 🧩 サイロ化されたデータウェアハウスの構築 🔄 変更に対する柔軟性 💰 コストの透明性 🔐 きめ細かい権限管理 データメッシュとは?
データ基盤のアーキテクチャ
☁️ プロジェクトの分離 事業部ごとにGoogle Cloudプロジェクト及びBigQueryを分離して運用 🔐 アクセス権の分離 各事業部がそれぞれのデータを管理し、アクセス権を事業ごとに管理 🔗 BigQuery Sharingによるデータ公開
データはBigQuery Sharingを利用して公開し、事業部横断のデータ活用を促進 事業部ごとのプロジェクト運用
📐 レイヤーで責任分界点を定める データチームは各チームが自立してデータを見れるように支援 責任分界点を定めて自立的な管理ができるように
ADKを活用して事業部横断の企業検索エージェントを作成した話 横断データ活用の事例
マルチプロダクトのデータ基盤設計 データメッシュを運用して見えた課題と伸びしろ 参考:データメッシュの運用についての発表
課題
📢 生成AI時代の事業戦略2026を発表 4つの新規AI事業を同時に発表 (PR TIMES) 🤖 Findy Insights 🤖 Findy
AI+ 🤖 アーキテクチャ壁打ちAI 🤖 Findy AI Career 新プロダクトを続々発表
📈 プロジェクトの増殖 プロダクトごとにGoogle Cloudプロジェクトが増え続ける構造 💰 メンテナンスコストの増大 IAM・予算・リソース管理が煩雑に、スケールしない仕組みに 🔄 同じ作業の繰り返し 新しいプロダクト追加のたびに同じようなインフラ構築が必要
プロダクト増加で何が起こったか
🧩 バラバラな技術選定 事業部ごとに独立管理、メンテナが個別に好みの技術を採用 ⚠️ 実行環境の乱立 Docker / GitHub Actions /
ローカル実行 etc. 🔒 属人化 各事業部で詳しい人しかメンテナンスできない状態に サイロ化するdbt実行環境
解決
💡 データメッシュの再解釈 プロジェクト単位ではなく、データセット単位でドメインを分離する 🔗 プロジェクトの統合 Google Cloudプロジェクトを一つに統合し、共通化と分権の境界を明確に 📘 DMBOKに基づく規範の策定 「すべてを分散させる」のではなく、何を共通化し何を分権するかを整理
方針転換
※ スペースの都合上、Findy転職とFindy Freelanceのみ記載 リアーキテクチャ後の構成
🏛️ 元々共通化済み IAM管理 / Cloud DLP / BigQuery Policy Tag
🆕 事業拡大で新たに標準化 CI検査項目 / Formatter・Linter / 実行環境(ランタイム) 🌐 引き続き分権 事業ドメイン / ビジネスイベント / データモデリング フェデレーテッド・ガバナンス
複数の実行環境をDockerに標準化 共通のDockerイメージをArtifact Registryで管理 各リポジトリはGitHub Reusable Workflowで共通Workflowを呼び出すだけ jobs: dbt-build: uses: org/shared-workflows/.github/workflows/dbt.yml@main
with: image_tag: "0.0.0" mount_path: "." dbt_args: "build --target prod" dbt ランタイムの共通化
ローカル実行時の共通コマンドをTaskfileのincludes機能で参照 各リポジトリは実装の詳細を意識せず、設定による利用のみ includes: common: taskfile: ./path/to/shared/Taskfile.yml tasks: lint: cmds: -
task: common:lint test: cmds: - task: common:test Taskfileの活用
スプレッドシートやLooker StudioからLookerへの移行 事業部ごとに散らばっていた指標を全社横断で集約 セマンティックレイヤーの活用 ビジネスロジックを統一し、全社的な指標管理を一元化 指標の定義は事業部に委譲 データエンジニアは横断組織であることを活かしてバランスを取る役割 事業部横断の指標管理:Lookerの導入
今後の展望
🔧 さらなるプラットフォーム化の推進 事業横断データ活用の拡充、セルフサービスでデータ活用できる仕組みの強化 🤖 AI Agent Readyなデータ基盤へ AIエージェントがデータを活用できる基盤の整備、データの発見可能性・アクセシビリティの 向上 今後の展望
まとめ
📖 これまで 事業部ごとにプロジェクトを分離、データメッシュで運用 ⚠️ 課題 プロダクト増加でサイロ化、管理コスト増大 🔧 解決 プロジェクト統合、共通化と分権のバランスを再設計 事業の成長に合わせてデータ基盤も進化し続ける
まとめ
複数プロダクト横断のデータ基盤を設計・開発しています! 興味ある方はご応募、カジュアル面談お待ちしています データエンジニア絶賛募集中です!
ご清聴 ありがとうございました