Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DTD_Databricksことはじめ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
BrainPad
January 29, 2026
Technology
0
18
DTD_Databricksことはじめ
BrainPad
January 29, 2026
Tweet
Share
More Decks by BrainPad
See All by BrainPad
DTD_AIエージェント開発プロジェクトのメソッドを体系化してみる
brainpadpr
0
27
【採用候補者向け】BrainPad AAAご紹介資料
brainpadpr
0
740
DTD_はじめての因子分析_理論とビジネス活用.pdf
brainpadpr
0
43
DTD_TensorRTを用いた自然言語処理モデルの高速化
brainpadpr
0
18
DTD_生成AIアシスタントのコスト最適化
brainpadpr
1
130
白金鉱業Vol.21【初学者向け発表枠】身近な例から学ぶ数理最適化の基礎 / Learning the Basics of Mathematical Optimization Through Everyday Examples
brainpadpr
1
570
三田データ_BrainPadAAA_AIエージェント元年を振り返る
brainpadpr
1
160
DTD_メタデータ管理とデータ品質管理の具体化
brainpadpr
0
180
DTD_これから始めるMCP基本のキ
brainpadpr
2
240
Other Decks in Technology
See All in Technology
ゼロから始めたFindy初のモバイルアプリ開発
grandbig
2
480
Agentic Coding 実践ワークショップ
watany
41
28k
The Engineer with a Three-Year Cycle - 2
e99h2121
0
200
エンジニアとマネジメントの距離/Engineering and Management
ikuodanaka
3
680
Riverpod3.xで実現する実践的UI実装
fumiyasac0921
2
350
3分でわかる!新機能 AWS Transform custom
sato4mi
1
260
OCI技術資料 : OS管理ハブ 概要
ocise
2
4.3k
日本語テキストと音楽の対照学習の技術とその応用
lycorptech_jp
PRO
1
360
ReproでのicebergのStreaming Writeの検証と実運用にむけた取り組み
joker1007
0
510
Azure SRE Agent x PagerDutyによる近未来インシデント対応への期待 / The Future of Incident Response: Azure SRE Agent x PagerDuty
aeonpeople
0
230
月間数億レコードのアクセスログ基盤を無停止・低コストでAWS移行せよ!アプリケーションエンジニアのSREチャレンジ💪
miyamu
0
120
AIとともに歩む情報セキュリティ / Information Security with AI
kanny
4
2.7k
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Visualization
eitanlees
150
17k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Agile that works and the tools we love
rasmusluckow
331
21k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
0
1.1k
[SF Ruby Conf 2025] Rails X
palkan
0
730
Become a Pro
speakerdeck
PRO
31
5.8k
Building the Perfect Custom Keyboard
takai
2
680
The Pragmatic Product Professional
lauravandoore
37
7.1k
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
1.9k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Transcript
Databricksことはじめ 2026年 01月29日(Ver1.0) 村田匡
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricks PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 3 1. 自己紹介 ・経歴: ・ 2013年
医療機器の会社に勤務 ・ 2021年 フリーランスのDSとして活動 ・ 2025年 株式会社ブレインパッド 入社 データエンジニアリングユニット プラットフォーム開発 ・プロジェクト経験: ・小売業でのデータ分析基盤の構築 ・統計関連の案件 ・趣味: ・統計学の勉強 ・ボードゲーム ・子供と遊ぶ
©BrainPad Inc. Strictly Confidential 4 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般)
©BrainPad Inc. Strictly Confidential 5 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般) • Databricksの社内向けデモ環境を立ち上げ(DEU 一部メンバーのみ)
©BrainPad Inc. Strictly Confidential 6 1. Databricksのパートナーになりました ブレインパッド、 Databricksの「システムインテグレーター コンサルティングパートナー」に登録
https://www.brainpad.co.jp/news/2025/12/04/24594
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 8 2. Databricksとは? 概要や特徴 Databricksとは?: 大規模なデータ分析、AI開発などを1つの場所で行うための
統合データ分析プラットフォーム • どこが便利なのか? • 使っているクラウド環境に接続するだけでOK • AWS、Azure、GCPなど、現在の環境・データをそのまま利用可能 • 環境が変わっても同じように使える • データの移行作業なども不要
©BrainPad Inc. Strictly Confidential 9 2. Databricksとは? 概要や特徴 Databricksで主にこんなことができます •
ETL:データの加工 • 定期実行(Job, Pipeline) • データ増分の自動取り込み(Auto Loader) • 大規模データの処理(Spark) • 加工後のテーブルを管理(Data Lineage) • BI:ダッシュボードで可視化して傾向を見る • データ分析:PythonやSQLで可視化 • ML:機械学習モデルを構築 https://docs.databricks.com/aws/ja/introduction/
©BrainPad Inc. Strictly Confidential 10 2. Databricksとは? よく質問を受ける内容 Q. クラウドの標準的な機能だけで同じことはできませんか?
A. 機能的には可能ですが、構築・運用にコストや手間がかかりそうです… • 比較:クラウドvs Databricks • 1. 分析やモデル管理機能を作る手間の有無 • 使い慣れた機能が良い粒度で入っている • 2. パフォーマンスや処理速度 • 処理エンジン(Spark)による大量データの高速分散処理が可能 • 3. データガバナンス(セキュリティ管理) • 「Unity Catalog」という機能により、ファイル、テーブル、AIモデルの権限を一元管理できる • ファイル、テーブル、AIモデルなどにアクセス権を細かく割り振れる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 12 3. Databricks PJで使うと良さそうな機能 • Unity
Catalog • Data Lineage • Serverless SQL Warehouse • Genie
©BrainPad Inc. Strictly Confidential 13 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる Cloud AWS, GCP,Azure など Unity Catalog in databricks
©BrainPad Inc. Strictly Confidential 14 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる
©BrainPad Inc. Strictly Confidential 15 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる アクセス可能にしたい アカウントを追加する アクセスの種別を追加する
©BrainPad Inc. Strictly Confidential 16 3. Databricks PJで使うと良さそうな機能 • Data
Lineage • テーブルを加工・保存した履歴を追跡できる どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 17 3. Databricks PJで使うと良さそうな機能 • Serverless
SQL Warehouse • 計算資源をクラウドから別途用意することなく、コンピュートリソースを利用できる
©BrainPad Inc. Strictly Confidential 19 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential 20 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential 23 3. Data Lineage • データ加工で、テーブルのトラッキング(Unity
Catalog のData Lineage) どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 24 3. 定期実行 Job • データ加工で、処理の方針が決まったら定期実行スケジュールを組める(Job)
https://docs.databricks.com/aws/ja/jobs/monitor いつ処理が 失敗しているかがわかる いつどの処理が 実行されたかがわかる
©BrainPad Inc. Strictly Confidential 25 3. Titanicデータの概要(補足) 姉妹兄弟/配偶者の数 親/子供の数 Master:男の子
3人の兄弟と来た 1人の親と来た Mrs:既婚女性 兄弟や旦那さんとは来てない 2人の親か子と来た
©BrainPad Inc. Strictly Confidential 26 3. MLモデルの管理 • 作成したモデルを管理
©BrainPad Inc. Strictly Confidential 27 3. MLモデルの管理 • モデルを管理し続けていて、例えば評価結果が閾値よりも値が低くなったらアラート 0.60
を下回っているので アラートを出す メールやSlackに通知が送られる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? notebookで
©BrainPad Inc. Strictly Confidential 29 3. EDA Python • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能 コードが長い… その割に書くことはお決まり
©BrainPad Inc. Strictly Confidential 30 3. EDA GoogleColabの場合
©BrainPad Inc. Strictly Confidential 31 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 32 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 33 3. DatabricksをML・BIで使うとどうなるか? Genie(補足) • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 34 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
名前の長さについて 調べてみることにしました。
©BrainPad Inc. Strictly Confidential 35 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 36 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? ダッシュボードで
©BrainPad Inc. Strictly Confidential 38 3. EDA BIでダッシュボードを使う • 既存のBIツールのようにダッシュボードを組める
©BrainPad Inc. Strictly Confidential 39 3. EDA BIでダッシュボードを使う • ダッシュボードはGenieと会話しながら組んでもらえる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 41 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる https://www.databricks.com/jp/blog/announcing-lakeflow-designer-no-code-etl
©BrainPad Inc. Strictly Confidential 42 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 43 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 44 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 45 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 47 5. まとめ Databricksを触ってみた所感 • 良いと思ったところ:
• 分散処理による高速処理ができる • 可視化が簡単にできる • データやモデルの管理が便利 • 今後に期待したいところ: • 参考記事が少ない印象
株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号 六本木ティーキューブ TEL:03-6721-7002 FAX:03-6721-7010 www.brainpad.co.jp
[email protected]
本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その 一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。
©BrainPad Inc.