Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
マルチプロダクトのデータ基盤設計 〜データメッシュを運用して見えた課題と伸びしろ〜
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Noriaki Hiraki
July 10, 2025
Technology
1.8k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
マルチプロダクトのデータ基盤設計 〜データメッシュを運用して見えた課題と伸びしろ〜
db tech showcase 2025 Tokyo
Noriaki Hiraki
July 10, 2025
More Decks by Noriaki Hiraki
See All by Noriaki Hiraki
ファインディの事業拡大を支える 拡張可能なデータ基盤へのリアーキテクチャ
hiracky16
0
1.5k
ADK + toolbox を使ってデータマネジメントやってみた話
hiracky16
1
95
ファインディにおける Dataform ブランチ戦略
hiracky16
1
500
マルチプロダクトのデータ基盤設計〜データメッシュへのリアーキテクチャで見えた課題と伸びしろ〜
hiracky16
0
650
Dataform を使った GAS によるデータ運用からの脱却
hiracky16
4
2.5k
Other Decks in Technology
See All in Technology
フィジカル版Github Onshapeの紹介
shiba_8ro
0
330
Zenoh on Zephyr on LiteX
takasehideki
2
110
「ビジネスがわかるエンジニア」とは何か?
ryooob
0
320
Oracle Cloud Infrastructure:2026年6月度サービス・アップデート
oracle4engineer
PRO
0
330
AIペネトレーションテスト・ セキュリティ検証「AgenticSec」紹介資料
laysakura
2
7.6k
從開發到部署全都交給 AI:實作 AI 驅動的自動化流程
appleboy
0
170
AIに障害切り分けを全部やってもらった。 。 。 。
estie
0
160
AI-DLCを “そのまま導入しなかった”話 ~組織に合わせてアジャストした 私たちの実践共有~
hiroramos4
PRO
1
430
徹底討論!ECS vs EKS!
daitak
3
1.7k
コミュニティの有益性 ~JAWS Days 2026 での体験を通して~ / The Benefits of a Community ~Through My Experience at JAWS Days 2026~
seike460
PRO
0
270
アラート調査向けAIエージェントの本番導入とその後/AI Agents for Alert Investigation: Production Deployment and After
taddy_919
0
150
[チョークトーク資料]AWS DevOps Agent を使いこなす / AWS Dev Ops Agent Chalk Talk AWS Summit Japan 2026
kinunori
4
770
Featured
See All Featured
HDC tutorial
michielstock
2
720
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.2k
What does AI have to do with Human Rights?
axbom
PRO
1
2.2k
Into the Great Unknown - MozCon
thekraken
41
2.6k
Discover your Explorer Soul
emna__ayadi
2
1.1k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
750
Large-scale JavaScript Application Architecture
addyosmani
515
110k
New Earth Scene 8
popppiees
3
2.4k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
850
Navigating Weather and Climate Data
rabernat
0
240
Paper Plane
katiecoart
PRO
1
52k
Transcript
マルチプロダクトのデータ基盤設計 〜データメッシュを運用して見えた課題と伸びしろ〜 db tech showcase 2025 Tokyo ファインディ株式会社 CTO 室データソリューションチーム
開 功昂(hiracky16)
自己紹介
3 自己紹介 Findy / データエンジニア 開 功昂 / Noriaki Hiraki
/ @hiracky16 • 2023/11 にファインディの CTO 室データソリュー ションチームにジョイン 🙌 • マルチプロダクトデータ基盤を設計開発をリード • サッカー⚽とかポッドキャスト 🎙が好きです
挑戦するエンジニアの プラットフォームをつくる。 テクノロジーによる社会変⾰の時代に最も必要なことは、エンジニアの可能性を拡げることです。 Findyは、アルゴリズムとヒューマニティの融合によって、 すべてのエンジニアが不安なく挑戦できる世界共通のプラットフォームをつくります。 個⼈のチャンスを⽣み出し、組織の⽣産性を向上させ、社会の⼈材資産を好循環させる。 エンジニアプラットフォームが、デジタル社会の発展を加速していきます。 ビジョン © Findy
Inc. 4
5 ファインディの事業
6 組織プラットフォーム事業 「組織」を見える化するアルゴリズム チームの生産性を可視化し、開発者体験を向上するためのアナリティクスツール 開発リードタイムの見える化 定量的なデータを活用して 1on1を活性化 自身のデータを振り返り
自己成長をスピードアップ
• 中央集権型の課題と「データメッシュ」を採用した理由 • データメッシュの 4 原則とファインディでの直近 2 年間の取り組み • データメッシュ実運用から見えてきたノウハウ
セッションで話すこと 7
ファインディの データ基盤と組織の伸びしろ
9 2 年前のファインディのデータ基盤
2 年前のファインディのデータ基盤 10
データメッシュへの 移行理由と背景
12 データメッシュとは? • 分散型のデータ基盤アーキテクチャ • 変更に対する柔軟性が向上 • コストの透明性 • きめ細かい権限管理
13 • 採用理由 ✅ ◦ 事業やチームごとにアクセス権を管理できる設計 ◦ データ蓄積や利活用の幅をより柔軟に広げられる • 懸念事項
⚠ ◦ 事業間の連携が遅くなる → ニーズがないので未考慮 ◦ データエンジニアが必要 → 採用頑張る💪 データメッシュへの移行理由と背景
データメッシュへの リアーキテクチャ
15 移行後のアーキテクチャ ※ スペースの都合で Findy, Findy Freelance のアーキテクチャを掲載
16 データメッシュに必要な 4 つの原則 分散型の データアーキテクチャ セルフサービスの データプラットフォーム プロダクトとしてのデータ フェデレーテッド・ガバナンス
17 データメッシュに必要な 4 つの原則 分散型の データアーキテクチャ セルフサービスの データプラットフォーム プロダクトとしてのデータ フェデレーテッド・ガバナンス
18 分散型のデータアーキテクチャ データメッシュの概念図 ファインディでのアーキテクチャ
19 各ドメインチームでデータを所有・管理できる体制を組織 事業ドメインに詳しいデータアナリストを募りデータオーナーとしてデータ品 質向上の活動を促す
20 データメッシュに必要な 4 つの原則 分散型の データアーキテクチャ セルフサービスの データプラットフォーム プロダクトとしてのデータ フェデレーテッド・ガバナンス
データカタログの提供 21
22 他部署へのデータシェアリング publish explore & subscribe develop query
23 データ品質に対する取り組み # GitHub Actions name: validate-sql on: pull_request: branches:
- main jobs: steps: - name: lint - name: coverage - name: dbt-build – user_count_by_skill.sql select skill, count(1) from `project_a.dataset_b.users` where created_at >= '2025-01-01' push review review review
24 データメッシュに必要な 4 つの原則 分散型の データアーキテクチャ セルフサービスの データプラットフォーム プロダクトとしてのデータ フェデレーテッド・ガバナンス
ノーコードで ETL パイプライン構築 25 ETL Reverse ETL
26 データ可視化のセルフサービス化 select changed_date, count(1) from `project_a.dataset_b.user_job_logs` where changed_date >=
'2025-01-01' explore: 転職分析 dim:change_month measure: count filter: change_date >= '2025-01-01' user_job_logs user_job_histories SELECT FROM ? logs or histories ? 月次の転職数
27 責任分界点・オーナーを明確化
28 各ドメインチームでデータ利活用をサポート データ基盤チームはドメインチームが自立してデータを管理できるように支援
29 データメッシュに必要な 4 つの原則 分散型の データアーキテクチャ セルフサービスの データプラットフォーム プロダクトとしてのデータ フェデレーテッド・ガバナンス
DMBOK で定義されるデータガバナンスの成果物(ドキュメント)を整備 データガバナンスに対する取り組み 30 全社 事業A 事業B Architecture architecture.
md architecture_ a.md architecture_ b.md Modeling modeling.md - - Security security.md security_a.md - Metadata metadata.md - - Storage storage.md - storage_b.md
31 個人情報への取り組み Policy Tag を用いた動的マスキング DLP API を用いた個人データのマスキング select text,
`function.dlp`(text) as masked_text – マスキング処理をリモート関数で提供 from messages
Terraform Private Module でインフラ構成を共通化 インフラ構成の共通化 32 publish pull &
apply
学んだ教訓と ベストプラクティス
34 システムと組織のリアーキテクトが必要 • 事業部サイドのアナリストやデータ活用者を巻き込むことが重要 • 責任範囲やオーナーを明確化することでセルフの範囲を定義
35 成果を出しながらリアーキテクチャを進める • 成果を小出しに進めなければリアーキも持続可能ではない • データエンジニアがストリームアラインドを支援、時には一緒に作業
36 Don’t Repeat Yourself • インフラは Terraform Private Module で共通化
• データは Analytics Hub で共通化することで SSoT を実現 • 共通化は工数削減やガバナンスの統一に効果がある
37 “セルフサービス” をレベルアップし続ける • 組織ごとやドメインによってセルフサービスの意味合いが違う • 技術の進歩によってアップデートし続ける必要がある DWH Transform ETL
Tool BI AI Agent?
• 社内のメディアを使ってアウトプットし続ける • テックブログ、イベントや Findy Tools への投稿でアウトプット 38 データエンジニアの採用に注力
まとめ
40 • データメッシュの 4 原則は抑えつつ設計は進めましょう • データインフラだけでなく組織構造のリアーキテクトが必要 • ドメインごとにその時の最適なセルフサービスを追求 •
データガバナンスを適用するために DRY を推進 • ファインディのイベントや Findy Tools はおすすめ まとめ
複数プロダクト横断データ基盤を設計・開発しています! 興味ある方はご応募、カジュアル面談お待ちしています→ データエンジニア 絶賛募集中です!!
ご清聴 ありがとうございました🙏