Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DTD_Databricksことはじめ
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
BrainPad
January 29, 2026
Technology
300
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
DTD_Databricksことはじめ
BrainPad
January 29, 2026
More Decks by BrainPad
See All by BrainPad
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
370
「ビジネス現場でのデータ分析者」 東京大学 GCI 2026 Summer
brainpadpr
1
2k
BrainPad_DE_202604
brainpadpr
1
14k
BrainPad AAA_AIエージェントの社会実装する上での壁 / Barriers to the Social Implementation of AI Agents
brainpadpr
1
250
白金鉱業Meetup_Vol.22_Orbital Senseを支える衛星画像のマルチモーダルエンベディングと地理空間のあいまい検索技術
brainpadpr
3
420
DTD_AIエージェント開発プロジェクトのメソッドを体系化してみる
brainpadpr
1
350
【採用候補者向け】BrainPad AAAご紹介資料
brainpadpr
0
2.1k
DTD_はじめての因子分析_理論とビジネス活用.pdf
brainpadpr
2
2.6k
DTD_TensorRTを用いた自然言語処理モデルの高速化
brainpadpr
0
130
Other Decks in Technology
See All in Technology
連合学習と機密コンピューティング
lycorptech_jp
PRO
0
120
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
1k
【NRUG vol.18】なぜ多くのオブザーバビリティ導入は失敗するのか
nrug_member
0
130
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
1k
AIはどのように 組織のアジリティを変えるのか?
junki
3
790
SONiCの統計情報を取得したい
sonic
0
160
How Timee Delivers Day 1 Production Ready LLM Features
tomoyks
0
230
AIエージェントが名古屋の猛暑からあなたを守る
happysamurai294
0
120
ACE-Step-1.5で見る 音楽生成AIのしくみと“破綻だけ直す”Retake機能の開発【zennfes spring 2026 登壇資料】
personabb
1
450
AIソロプレナー時代に2ヶ月で20人増員した事業創造会社の開発組織の話
miyatakoji
0
660
自律型AIエージェントは何を破壊するのか
kojira
0
160
Bedrock AgentCore RuntimeでAuth0 Changelog調査AIをアップグレードした話
t5u8a5a
1
140
Featured
See All Featured
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
How GitHub (no longer) Works
holman
316
150k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
470
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
310
From π to Pie charts
rasagy
0
210
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
300
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
420
GitHub's CSS Performance
jonrohan
1033
470k
Done Done
chrislema
186
16k
Transcript
Databricksことはじめ 2026年 01月29日(Ver1.0) 村田匡
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricks PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 3 1. 自己紹介 ・経歴: ・ 2013年
医療機器の会社に勤務 ・ 2021年 フリーランスのDSとして活動 ・ 2025年 株式会社ブレインパッド 入社 データエンジニアリングユニット プラットフォーム開発 ・プロジェクト経験: ・小売業でのデータ分析基盤の構築 ・統計関連の案件 ・趣味: ・統計学の勉強 ・ボードゲーム ・子供と遊ぶ
©BrainPad Inc. Strictly Confidential 4 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般)
©BrainPad Inc. Strictly Confidential 5 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般) • Databricksの社内向けデモ環境を立ち上げ(DEU 一部メンバーのみ)
©BrainPad Inc. Strictly Confidential 6 1. Databricksのパートナーになりました ブレインパッド、 Databricksの「システムインテグレーター コンサルティングパートナー」に登録
https://www.brainpad.co.jp/news/2025/12/04/24594
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 8 2. Databricksとは? 概要や特徴 Databricksとは?: 大規模なデータ分析、AI開発などを1つの場所で行うための
統合データ分析プラットフォーム • どこが便利なのか? • 使っているクラウド環境に接続するだけでOK • AWS、Azure、GCPなど、現在の環境・データをそのまま利用可能 • 環境が変わっても同じように使える • データの移行作業なども不要
©BrainPad Inc. Strictly Confidential 9 2. Databricksとは? 概要や特徴 Databricksで主にこんなことができます •
ETL:データの加工 • 定期実行(Job, Pipeline) • データ増分の自動取り込み(Auto Loader) • 大規模データの処理(Spark) • 加工後のテーブルを管理(Data Lineage) • BI:ダッシュボードで可視化して傾向を見る • データ分析:PythonやSQLで可視化 • ML:機械学習モデルを構築 https://docs.databricks.com/aws/ja/introduction/
©BrainPad Inc. Strictly Confidential 10 2. Databricksとは? よく質問を受ける内容 Q. クラウドの標準的な機能だけで同じことはできませんか?
A. 機能的には可能ですが、構築・運用にコストや手間がかかりそうです… • 比較:クラウドvs Databricks • 1. 分析やモデル管理機能を作る手間の有無 • 使い慣れた機能が良い粒度で入っている • 2. パフォーマンスや処理速度 • 処理エンジン(Spark)による大量データの高速分散処理が可能 • 3. データガバナンス(セキュリティ管理) • 「Unity Catalog」という機能により、ファイル、テーブル、AIモデルの権限を一元管理できる • ファイル、テーブル、AIモデルなどにアクセス権を細かく割り振れる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 12 3. Databricks PJで使うと良さそうな機能 • Unity
Catalog • Data Lineage • Serverless SQL Warehouse • Genie
©BrainPad Inc. Strictly Confidential 13 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる Cloud AWS, GCP,Azure など Unity Catalog in databricks
©BrainPad Inc. Strictly Confidential 14 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる
©BrainPad Inc. Strictly Confidential 15 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる アクセス可能にしたい アカウントを追加する アクセスの種別を追加する
©BrainPad Inc. Strictly Confidential 16 3. Databricks PJで使うと良さそうな機能 • Data
Lineage • テーブルを加工・保存した履歴を追跡できる どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 17 3. Databricks PJで使うと良さそうな機能 • Serverless
SQL Warehouse • 計算資源をクラウドから別途用意することなく、コンピュートリソースを利用できる
©BrainPad Inc. Strictly Confidential 19 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential 20 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential 23 3. Data Lineage • データ加工で、テーブルのトラッキング(Unity
Catalog のData Lineage) どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 24 3. 定期実行 Job • データ加工で、処理の方針が決まったら定期実行スケジュールを組める(Job)
https://docs.databricks.com/aws/ja/jobs/monitor いつ処理が 失敗しているかがわかる いつどの処理が 実行されたかがわかる
©BrainPad Inc. Strictly Confidential 25 3. Titanicデータの概要(補足) 姉妹兄弟/配偶者の数 親/子供の数 Master:男の子
3人の兄弟と来た 1人の親と来た Mrs:既婚女性 兄弟や旦那さんとは来てない 2人の親か子と来た
©BrainPad Inc. Strictly Confidential 26 3. MLモデルの管理 • 作成したモデルを管理
©BrainPad Inc. Strictly Confidential 27 3. MLモデルの管理 • モデルを管理し続けていて、例えば評価結果が閾値よりも値が低くなったらアラート 0.60
を下回っているので アラートを出す メールやSlackに通知が送られる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? notebookで
©BrainPad Inc. Strictly Confidential 29 3. EDA Python • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能 コードが長い… その割に書くことはお決まり
©BrainPad Inc. Strictly Confidential 30 3. EDA GoogleColabの場合
©BrainPad Inc. Strictly Confidential 31 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 32 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 33 3. DatabricksをML・BIで使うとどうなるか? Genie(補足) • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 34 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
名前の長さについて 調べてみることにしました。
©BrainPad Inc. Strictly Confidential 35 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 36 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? ダッシュボードで
©BrainPad Inc. Strictly Confidential 38 3. EDA BIでダッシュボードを使う • 既存のBIツールのようにダッシュボードを組める
©BrainPad Inc. Strictly Confidential 39 3. EDA BIでダッシュボードを使う • ダッシュボードはGenieと会話しながら組んでもらえる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 41 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる https://www.databricks.com/jp/blog/announcing-lakeflow-designer-no-code-etl
©BrainPad Inc. Strictly Confidential 42 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 43 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 44 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 45 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 47 5. まとめ Databricksを触ってみた所感 • 良いと思ったところ:
• 分散処理による高速処理ができる • 可視化が簡単にできる • データやモデルの管理が便利 • 今後に期待したいところ: • 参考記事が少ない印象
株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号 六本木ティーキューブ TEL:03-6721-7002 FAX:03-6721-7010 www.brainpad.co.jp
[email protected]
本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その 一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。
©BrainPad Inc.