Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Search
Kenji Matsuda
March 26, 2026
Technology
140
0
Share
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Kenji Matsuda
March 26, 2026
Other Decks in Technology
See All in Technology
AIガバナンス実践 - 生成AIコネクタのデータ漏洩リスクと実務対策
knishioka
0
170
TROCCOで始めるクラウドコストを民主化するためのFinOps
tk3fftk
3
560
イベントストーミングとKiroの仕様駆動開発で実現する要件の認識合わせプロセス
syobochim
7
1.1k
Unlocking the Apps
pimterry
0
190
速さだけじゃない! VoidZero ツールが移行先に選ばれる理由
mizdra
PRO
6
730
PHP と TypeScript の型システム比較:AI 時代の「型」は誰のためにあるのか? #frontend_phpcon_do / frontend_phpcon_do_2026
shogogg
1
240
トークン数だけでは測れない — Claude Code 組織展開の効果検証から学んだこと
makikub
0
120
地元にいないローカルオーガナイザーの立ち回り
uvb_76
1
450
オンコールの負荷軽減のためのBits Assistant 活用方法 / How to Use Bits Assistant to Reduce the Workload on On-Call Staff
sms_tech
1
380
noUncheckedIndexedAccess、3時間、1万円。 / noUncheckedIndexedAccess, 3 Hours, 10,000 JPY.
kaonavi
1
170
React、まだ楽しくて草
uhyo
7
3.9k
製造業のクラウド活用最適解〜AI,DXを加速するデータ基盤の作り方〜
hamadakoji
0
330
Featured
See All Featured
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
210
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
260
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
The browser strikes back
jonoalderson
0
1.1k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
190
How to train your dragon (web standard)
notwaldorf
97
6.7k
Being A Developer After 40
akosma
91
590k
Odyssey Design
rkendrick25
PRO
2
670
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
150
Into the Great Unknown - MozCon
thekraken
41
2.5k
Transcript
@IVRy Inc. All rights reserved. Databricks Lakehouse Federationで 運⽤負荷ゼロのデータ連携 株式会社IVRy
データエンジニア 松⽥ 健司 JEDAI Meetup! AIエージェント特集 - Lakebase連携からセキュリティまで
ヤフー株式会社(2014 - 2016) 新卒⼊社し、広告配信システムのDMP開発に従事。 株式会社カケハシ(2016 - 2025) 薬局向けSaaSのスタートアップに6⼈⽬として参画。 ソフトウェア開発を起点に、データエンジニア、 エンジニアリングマネージャーまで、事業の成⻑に
合わせて幅広く経験。 株式会社IVRy(2025) データエンジニアとして、データ基盤の構築に従事。 松⽥ 健司 Data Engineer @ken_3ba 2
IVRとAIであらゆる電話対応を効率化 「アイブリー」 3 プロダクト
IVRy Data Hub をリリース 4
5 オフィスの壁が拡張されました
@IVRy Inc. All rights reserved. 今⽇話すこと 6 https://zenn.dev/ivry/articles/databricks-lakehouse-federation-guide
@IVRy Inc. All rights reserved. アジェンダ 7 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. Lakehouse Federationとは? 8 外部データベースのデータをコピーせず に
Unity Catalog 経由で直接クエリできる機能 メリット • データコピー不要 → ETLジョブ・ストレージコスト削減 • リアルタイム参照 → ソースDBの最新データを直接参照 • Unity Catalog でガバナンス統一 → アクセス制御・リネージを一元管理 なぜ Lakehouse Federation を導⼊したのか
@IVRy Inc. All rights reserved. IVRyのデータアーキテクチャ 9 なぜ Lakehouse Federation
を導⼊したのか https://findy-tools.io/companies/ivry/90/76
@IVRy Inc. All rights reserved. 10 なぜ Lakehouse Federation を導⼊したのか
課題:テーブルが増えるたびに 人手が必要 な運用だった Created by Nano banana
@IVRy Inc. All rights reserved. アジェンダ 11 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後のアーキテクチャと View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 12 導⼊後のアーキテクチャとView の⾃動作成の仕組み 導入後のアーキテクチャ パフォーマンスを考慮し、大規模テーブルはdltHubによる差分更新を維持
@IVRy Inc. All rights reserved. 13 導⼊後のアーキテクチャとView の⾃動作成の仕組み Viewを自動作成・削除するテーブルの選定 作成と削除はDatabricks
SQLで、対象外はdbtで管理
@IVRy Inc. All rights reserved. アジェンダ 14 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 15 ハマったポイント その1: NLB の
PrivateLink 設定 PrivateLink経由の通信はSGのチェックをスルーする必要があった https://docs.databricks.com/aws/en/security/network/serverless-networ k-security/pl-to-internal-network
@IVRy Inc. All rights reserved. 16 ハマったポイント その2: NCCの制約 ワークスペースが単一のNCCにしかバインドできなかったため、
全ワークスペースを 1つのNCCに統合する方針 で運用
@IVRy Inc. All rights reserved. 17 ハマったポイント その3: ServerlessとClassicで接続ルートが異なる 一部のジョブがClassicのままだったためFederationカタログを参照すると
エラーが発生した →ServerlessはPricateLink、ClassicはVPC Pering経由に! https://docs.databricks.com/aws/en/security/network/serverless-network-security/ pl-to-internal-network
@IVRy Inc. All rights reserved. アジェンダ 18 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 19 まとめと今後 まとめ: 導入の成果 大規模テーブルと
PII テーブルは Federation から除外し、 安全かつパフォーマンスの良い構成に Before After テーブルの追加 Slack申請→手動対応 自動 データ鮮度 数時間に一度 リアルタイム コスト ジョブとストレージ ゼロ 運用負荷 ジョブ監視・障害対応 ほぼゼロ
@IVRy Inc. All rights reserved. 20 まとめと今後 今後 1. データ削除時の影響
◦ PostgreSQLのデータが削除されると後続のデータ利用に影響が出る問題 への対応 2. 大規模テーブルの対応 ◦ dltHubをLakeflow Connectを利用してCDC 更新へ移行し、 よりリアルタイムかつコスト削減した連携を目指す
@IVRy Inc. All rights reserved. we are hiring 21