Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Kenji Matsuda
March 26, 2026
Technology
140
0
Share
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Kenji Matsuda
March 26, 2026
Other Decks in Technology
See All in Technology
トークン数だけでは測れない — Claude Code 組織展開の効果検証から学んだこと
makikub
0
120
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
2
210
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.8k
運用を見据えたAIエージェント設計実践
amacbee
1
2.4k
Java正規表現エンジン(NFA)の仕組みと パフォーマンスを維持するための最適化手法
takeuchi_132917
0
180
【Gen-AX】20260530開催_JJUG CCC 2026 Spring
genax
0
400
「速く作る」から「正しく作る」へ ─ 生成AI時代の開発フロー改革の ロードマップと実行 ─
starfish719
0
6.1k
美味しいスイスチーズを作ろう🧀🐭
taigamikami
1
230
製造業のクラウド活用最適解〜AI,DXを加速するデータ基盤の作り方〜
hamadakoji
0
330
Javaコミュニティをもっと楽しむための9箇条
takasyou
0
1.2k
探して_入れて_作って_使う_Agent_Skills___LT.pdf
peintangos
2
160
はじめてのDatadog
kairim0
0
270
Featured
See All Featured
Crafting Experiences
bethany
1
160
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
170
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
160
Skip the Path - Find Your Career Trail
mkilby
1
140
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
Making Projects Easy
brettharned
120
6.7k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
570
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
74k
Transcript
@IVRy Inc. All rights reserved. Databricks Lakehouse Federationで 運⽤負荷ゼロのデータ連携 株式会社IVRy
データエンジニア 松⽥ 健司 JEDAI Meetup! AIエージェント特集 - Lakebase連携からセキュリティまで
ヤフー株式会社(2014 - 2016) 新卒⼊社し、広告配信システムのDMP開発に従事。 株式会社カケハシ(2016 - 2025) 薬局向けSaaSのスタートアップに6⼈⽬として参画。 ソフトウェア開発を起点に、データエンジニア、 エンジニアリングマネージャーまで、事業の成⻑に
合わせて幅広く経験。 株式会社IVRy(2025) データエンジニアとして、データ基盤の構築に従事。 松⽥ 健司 Data Engineer @ken_3ba 2
IVRとAIであらゆる電話対応を効率化 「アイブリー」 3 プロダクト
IVRy Data Hub をリリース 4
5 オフィスの壁が拡張されました
@IVRy Inc. All rights reserved. 今⽇話すこと 6 https://zenn.dev/ivry/articles/databricks-lakehouse-federation-guide
@IVRy Inc. All rights reserved. アジェンダ 7 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. Lakehouse Federationとは? 8 外部データベースのデータをコピーせず に
Unity Catalog 経由で直接クエリできる機能 メリット • データコピー不要 → ETLジョブ・ストレージコスト削減 • リアルタイム参照 → ソースDBの最新データを直接参照 • Unity Catalog でガバナンス統一 → アクセス制御・リネージを一元管理 なぜ Lakehouse Federation を導⼊したのか
@IVRy Inc. All rights reserved. IVRyのデータアーキテクチャ 9 なぜ Lakehouse Federation
を導⼊したのか https://findy-tools.io/companies/ivry/90/76
@IVRy Inc. All rights reserved. 10 なぜ Lakehouse Federation を導⼊したのか
課題:テーブルが増えるたびに 人手が必要 な運用だった Created by Nano banana
@IVRy Inc. All rights reserved. アジェンダ 11 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後のアーキテクチャと View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 12 導⼊後のアーキテクチャとView の⾃動作成の仕組み 導入後のアーキテクチャ パフォーマンスを考慮し、大規模テーブルはdltHubによる差分更新を維持
@IVRy Inc. All rights reserved. 13 導⼊後のアーキテクチャとView の⾃動作成の仕組み Viewを自動作成・削除するテーブルの選定 作成と削除はDatabricks
SQLで、対象外はdbtで管理
@IVRy Inc. All rights reserved. アジェンダ 14 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 15 ハマったポイント その1: NLB の
PrivateLink 設定 PrivateLink経由の通信はSGのチェックをスルーする必要があった https://docs.databricks.com/aws/en/security/network/serverless-networ k-security/pl-to-internal-network
@IVRy Inc. All rights reserved. 16 ハマったポイント その2: NCCの制約 ワークスペースが単一のNCCにしかバインドできなかったため、
全ワークスペースを 1つのNCCに統合する方針 で運用
@IVRy Inc. All rights reserved. 17 ハマったポイント その3: ServerlessとClassicで接続ルートが異なる 一部のジョブがClassicのままだったためFederationカタログを参照すると
エラーが発生した →ServerlessはPricateLink、ClassicはVPC Pering経由に! https://docs.databricks.com/aws/en/security/network/serverless-network-security/ pl-to-internal-network
@IVRy Inc. All rights reserved. アジェンダ 18 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 19 まとめと今後 まとめ: 導入の成果 大規模テーブルと
PII テーブルは Federation から除外し、 安全かつパフォーマンスの良い構成に Before After テーブルの追加 Slack申請→手動対応 自動 データ鮮度 数時間に一度 リアルタイム コスト ジョブとストレージ ゼロ 運用負荷 ジョブ監視・障害対応 ほぼゼロ
@IVRy Inc. All rights reserved. 20 まとめと今後 今後 1. データ削除時の影響
◦ PostgreSQLのデータが削除されると後続のデータ利用に影響が出る問題 への対応 2. 大規模テーブルの対応 ◦ dltHubをLakeflow Connectを利用してCDC 更新へ移行し、 よりリアルタイムかつコスト削減した連携を目指す
@IVRy Inc. All rights reserved. we are hiring 21