Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Databricks AI/BIクイックワークショップ

Databricks AI/BIクイックワークショップ

Databricks AI/BIクイックワークショップのスライド

本編: https://speakerdeck.com/databricksjapan/aibi-quick-workshop/
環境セットアップガイド: https://speakerdeck.com/databricksjapan/aibi-quick-workshop-environment-setup-guide/

Databricks Japan

February 03, 2025
Tweet

More Decks by Databricks Japan

Other Decks in Technology

Transcript

  1. ©2025 Databricks Inc. — All rights reserved 1 データブリックス・ジャパン株式会社 2025年2月

    1 2時間で身につく! Databricks AI/BI クイックワークショップ
  2. ©2025 Databricks Inc. — All rights reserved 2時間で身につく! Databricks AI/BIクイックワークショップ

    データ分析の世界が大きく変わろうとしています。 AIの進化により専門知識がなくても 自然な会話感覚 でデータを 分析できる時代が到来しました。 2時間のワークショップを通じて、 ビジネスユーザー の皆様にDatabricksのAI/BI を活用した次世代のデータ分析を ハンズオン 形式で体験いただきます。 主な対象者 • 業務データの分析に興味をお持ちのビジネスユーザー • Databricksの経験は不問です ※ SQLやExcel/Power BI/Tableauなどのツールを用いた業務データ 分析の経験があることが望ましいですが、必須ではありません ゴール 事前準備 アジェンダ 1. Databricksの全体像の紹介(15分) 2. Unity Catalog & AI/BI 概要説明(15分) 3. ハンズオン (75分) ◦ Unity Catalog・AI/BIダッシュボード・AI/BI Genie • Databricksによるデータ分析の新しい可能性 を理解する • AIを活用したデータ分析手法の効果を体感 する • 自社のデータ分析業務の改革に向けたヒント を得る • 環境:お客様のDatabricks環境を利用いただきます • データ:弊社よりサンプルデータを提供いたします ※ ワークショップ開催の 1週間前までに、環境の確認・設定に関する 事前打ち合わせを実施させていただきます (約1時間)
  3. ©2025 Databricks Inc. — All rights reserved 環境セットアップガイドへのリンク • AI/BIクイックワークショップ環境セットアップガイド

    (Speaker Deck) • https://speakerdeck.com/databricksjapan/aibi-quick-workshop-environment-s etup-guide • サンプルテーブル作成用ノートブック (GitHub) • https://github.com/nakazax/databricks-aibi-quick-workshop-ja 本ワークショップをセルフサービスで実施する場合、 以下のリンクを利用してワークショップ環境をセットアップください
  4. ©2025 Databricks Inc. — All rights reserved Agenda 1. Databricksの全体像の紹介(

    15分) 2. Unity Catalog & AI/BI 概要説明(15分) 3. ハンズオン(75分) ◦ Unity Catalog(15分) ◦ AI/BI ダッシュボード(30分) ◦ AI/BI Genie(30分) 4. アンケート・質疑応答(10分)
  5. ©2025 Databricks Inc. — All rights reserved データ & AI

    カンパニー Creator of: 9 10,000+ 顧客数 $2.4B+ 年間売上 $43B+ 推定企業価値 レイクハウス の発明者で 生成AI のパイオニア ガートナーが認知するリーダーの 1社 - Cloud Database Management Systems - Data Science and ML Platforms 2013年設立 (日本法人は2019年設立)
  6. ©2025 Databricks Inc. — All rights reserved データ変換 ペタバイト級 データ分析

    SQL, BI モデル開発〜提供 機械学習 Databricksの得意分野
  7. ©2025 Databricks Inc. — All rights reserved ノートブック データ分析、ETL、機械学習、アプリ開発まで行える万能インターフェイス マルチ言語対応

    SQL / Python / R / Scala リアルタイム共同編集 柔軟なクラスター管理 処理や負荷に応じたスペック選択 サーバーレスオプション 開発者フレンドリー 生成AIアシスタントによる支援、 自動履歴保存、Git連携、 変数の表示、デバッグ etc. 機能紹介 1/4
  8. ©2025 Databricks Inc. — All rights reserved SQLウェアハウス 高性能・低コストなSQLとBIの実行基盤 SQL

    & 組み込みの BI SQLエディタ、SQLノートブック、 ダッシュボード、Genieの実行基盤 主要BIツールからの接続性 Power BI / Tableau / Looker etc. JDBC / ODBC接続をサポート アドバンスドな機能 ユーザー定義関数 / AI (LLM) 関数 フェデレーションクエリ(Snowflake / BigQuery / Redshift / 各種RDB etc.) 機能紹介 2/4
  9. ©2025 Databricks Inc. — All rights reserved 機械学習 実験から本番運用まで MLOpsをワンストップで実現

    ライフサイクル管理 実験管理、モデル管理、サービング、 モニタリングまで一気通貫でサポート リアルタイム推論 本番環境グレードのサーバーレスの リアルタイム推論エンドポイント LLM機能 カスタムLLMの構築・Fine Tuning AIエージェントの開発から評価まで 機能紹介 3/4 AutoML ノーコードで迅速なモデル開発 生成されたノートブックでさらに改善
  10. ©2025 Databricks Inc. — All rights reserved Databricks Apps セキュアなデータ

    & AIアプリを 迅速に構築 機能紹介 4/4 シンプルにアプリを構築可能 使いなれたPythonフレームワークを用いて アプリを素早く構築、実行できる。用意された Python テンプレートから選択も可能 本番環境対応 Gitバージョン管理、CI/CDサポートにより 本番環境対応のアプリケーションを実行可能 セキュリティとガバナンス Unity Catalog、OIDC/OAuth 2.0とSSOによる セキュアなユーザー認証を提供 2025年2〜4月にGA予定 AWS, Azure, GCPの米国リージョンなどで利用可能 日本リージョンへの展開予定は未定
  11. ©2025 Databricks Inc. — All rights reserved データ変換 ペタバイト級 データ分析

    SQL, BI 生成AI 活用〜カスタマイズ モデル開発〜提供 機械学習 Databricksの得意分野 活用/ シンプル化
  12. ©2025 Databricks Inc. — All rights reserved 2024年11月13日放送 テレビ東京 Newsモーニングサテライト

    Databricks共同創業者 アルサラン・タバコリ インタビューより 顧客が保有するデータ と紐付けて 1つのサービスで生成AIを動作させる技術 “ ” 生成AI分野でのDatabricksの独自性
  13. ©2025 Databricks Inc. — All rights reserved 顧客が保有するデータ と紐付けて 1つのサービスで生成AIを動作させる技術

    “ ” 生成AI分野でのDatabricksの独自性 データインテリジェンス 汎用インテリジェンスではなく
  14. ディザスターリカバリ コストコントロール エンタープライズセキュリティ 100% サーバレス レイクハウス AI/BI ビジネス インテリジェンス Databricks

    SQL データウェアハウス Workflows/DLT 取り込み、ETL ストリーミング Mosaic AI 人工知能 Databricksデータインテリジェンスプラットフォーム
  15. ディザスターリカバリ コストコントロール エンタープライズセキュリティ 100% サーバレス レイクハウス AI/BI ビジネス インテリジェンス Databricks

    SQL データウェアハウス Workflows/DLT 取り込み、ETL ストリーミング Mosaic AI 人工知能 Databricksデータインテリジェンスプラットフォーム 本日の テーマ
  16. ©2025 Databricks Inc. — All rights reserved Agenda 1. Databricksの全体像の紹介(15分)

    2. Unity Catalog & AI/BI 概要説明( 15分) 3. ハンズオン(75分) ◦ Unity Catalog(15分) ◦ AI/BI ダッシュボード(30分) ◦ AI/BI Genie(30分) 4. アンケート・質疑応答(10分)
  17. ©2025 Databricks Inc. — All rights reserved Q. データガバナンスとは? •

    デジタルビジネスを拡大しようとする組織 の80%は、不十分なガバナンスが原因で 失敗している(Gartner) • データガバナンスの不備により、ユーザー の時間の30%が付加価値のない タスクに費やされている(McKinsey) • データガバナンスの不備は、年間1,500万 ドルもの財務的損失 をもたらす可能性が ある(investopedia) A. データ資産について、ライフサイクル全体を通して管理するための、 原則、プラクティス(実践的な手法)、ツールを組み合わせた総合的な管理手法 監査 共有 アクセス制御 リネージ ディスカバリー データの使用状況の把握(利用者、時期) 社内外へのデータの安全な共有 データ保護の仕組み・方法 データの関連性とライフサイクルの追跡 データの容易な検索・検出 事実 主要なテーマ
  18. ©2024 Databricks Inc. — All rights reserved 従来の カタログ Unity

    Catalog Delta Lake Parquet Iceberg アクセス制御 発見・検出 リネージ 監査 安全な データ共有 品質 モニタリング コスト制御 ビジネス上の 意味 セキュリティ コラボレーション 品質 管理 テーブル AIモデル ファイル Notebooks Dashboards あらゆる外部 データソースと接続 あらゆるツール、エンジン、プ ラットフォームとの オープンなアクセスと連携 データとAIを一元管理する ガバナンス基盤
  19. ©2025 Databricks Inc. — All rights reserved データについての詳細を調べることができるポータルとして機能 カタログエクスプローラー テーブル構造・説明

    列名、データ型、 ビジネスメタデータ 等 その他基本情報 作成/最終更新の日時、 ユーザー、ストレージの場 所、テーブルプロパティ 等 履歴 いつ、誰が、どのコードやジョ ブでどんな処理をしたか、等 を一覧表示 アクセス権限 アクセスできるユーザーや 権限の種類 データリネージュ 他のデータとの依存関係の 可視化、ジョブやMLモデル、 コードとの関連も表示 利用状況 このテーブルを使用している 主なユーザー、クエリやコー ド、利用頻度 等を可視化 データプロファイル データの中身に関する様々 な統計、データ品質のダッ シュボード
  20. ディザスターリカバリ コストコントロール エンタープライズセキュリティ 100% サーバレス レイクハウス AI/BI ビジネス インテリジェンス Databricks

    SQL データウェアハウス Workflows/DLT 取り込み、ETL ストリーミング Mosaic AI 人工知能 Databricksデータインテリジェンスプラットフォーム 本日の テーマ
  21. ©2025 Databricks Inc. — All rights reserved Databricks AI/BI インテリジェントな

    分析をあらゆる人に 29 Unity Catalogによるガバナンス Databricks SQLが実行基盤 ダッシュボード 組織全体に対して 迅速かつ安全に 視覚的な洞察を提供 Genie 自然言語を使って データと会話
  22. ©2025 Databricks Inc. — All rights reserved AI/BI ダッシュボード データを可視化

    AI支援による BI開発 自然言語を用いて、データセット、 ビジュアル、ダッシュボードを 素早く作成 統合されたガバナンスと セキュリティ 生データからダッシュボードまで、 エンドツーエンドでリネージを追跡 リアルタイムのインサイト提供 従来のBIツールの様にデータの範囲や 鮮度を犠牲にせず、リアルタイムに インサイトを提供 一般提供(GA)
  23. ©2025 Databricks Inc. — All rights reserved AI支援によるデータ分析と可視化 自然言語を用いて ダッシュボードに

    必要なデータセットを作成 自然言語と画面のクリックで 新しいビジュアルを作成
  24. ©2025 Databricks Inc. — All rights reserved データとBIの統合的なガバナンスとセキュリティ エンドツーエンド・列レベルのリネージ データパイプラインの変更が

    下流のダッシュボードにどんな影響を 与えるかを列レベルで把握 データと BI資産を一元的に管理・保護 Databricks外で特別なガバナンスモデルや データウェアハウスを準備する必要なし Unity Catalog
  25. ©2025 Databricks Inc. — All rights reserved すべてのデータを用いて 超高速・インタラクティブ にインサイトを得る

    あらゆる規模に対応する 超高速で インタラクティブなダッシュボード すべてのデータ を用いた分析 vs. 抽出データのみを用いた分析 常に最新のデータで リアルタイムの分析 を構築・展開
  26. ©2025 Databricks Inc. — All rights reserved ユニーク ユーザー数は? 国別の売上の

    推移は? 最も重要な 顧客層は? 最もポピュラーな 配送方法は? 注文の優先度の 変化の傾向は? 注文の優先度別の 売上の構成は? たしかに、良いダッシュボードは 多くの質問に答えてくれる
  27. ©2025 Databricks Inc. — All rights reserved あなたが予測できるのは ユーザーが尋ねる質問のほんの一部 ユニーク

    ユーザー数は? 国別の売上の 推移は? 最も重要な 顧客層は? 最もポピュラーな 配送方法は? 注文の優先度の 変化の傾向は? 注文の優先度別の 売上の構成は? 主要なサプライ ヤーは? 現在の 在庫レベルは? 最もリードタイムが 長いサプライヤー は? サプライチェーン のボトルネックは どこか? 配送の 遅延頻度は? 欠品が発生してい る製品は? 需要予測の精度 は? 余剰在庫がある 場所は? 場所別の在庫の 状況は? 最も利益が大きい 製品は? 配送遅延の コストは? 品質に問題のあ るサプライヤー は? 平均的な注文履 行時間は? 輸送コストの 傾向は? 配送コストの 傾向は? サプライヤーの契 約義務の遵守状況 は? 製品別の返品率 は? 倉庫の稼働率 は? 持続可能性目標 の達成状況は?
  28. ©2025 Databricks Inc. — All rights reserved AI/BI Genie データと会話

    セルフサービスでの Q&A ダッシュボードの更に先へ:ユーザー が自らのデータと自然言語を通じて会 話しインサイトを得られる データインテリジェンスを 活用したAI AIはユーザーデータに固有の知識を 元に回答、ユーザーフィードバックを 通じた精度の向上が可能 ガバナンスとセキュリティ ユーザーがアクセス可能なデータは Unity Catalogで完全に管理 一般提供(GA)
  29. ©2025 Databricks Inc. — All rights reserved GENIE Query Agent

    Query Agent AIエージェント ユーザー固有のデータの 意味を継続的に学習する エージェントシステム 専門のAIエージェントが協調して動作するアンサンブル方式 必要に応じてユーザーに確認を求める ツールとコンテキストの活用 • Unity Catalogのメタデータ • クエリ履歴 (すべてのワークロード ) • 関連する資産 (ノートブック、ダッシュボード、クエリ ) • セマンティックモデル (利用可能な場合 ) 学習し、記憶する 質問は何でしょうか? ユーザーデータの意味を 継続的に理解
  30. ©2025 Databricks Inc. — All rights reserved ダッシュボードの更に先へ 自社が持つデータに直接、 対話型のQ&Aを行う

    Genieが会話のスレッドを保存、 前回の続きから再開できる Genieは自然言語、表形式、 グラフを使って回答
  31. ©2025 Databricks Inc. — All rights reserved データインテリジェンス を活用した AIによる精度の高い回答

    データプラットフォーム からのインテリジェンス 管理者の指示を通じた インテリジェンス ユーザーフィードバックを 通じたインテリジェンス GenieはUnity Catalogのテーブルの スキーマ、コメント、PK/FK関係を 理解する。加えて、ダッシュボード内の SQLクエリも理解する。 Genieスペースの管理者は、指示(例:SQL クエリ、ビジネスルール、セマンティクス)を 通じて更にインテリジェンスを追加できる。 質問にどのように回答すべきか不確かな場合、 Genieは回答を推測するのでなくユーザーに明 確化を求める。ユーザーはリアルタイムで フィードバックを提供することで、Genieの回答 精度を更に向上できる。
  32. ©2025 Databricks Inc. — All rights reserved AIが生成するインサイトに ガバナンスとセキュリティ を適用

    Genieのモニタリング機能 を用いることで、ユーザー が質問した内容をレビューできる。評価 (良い/悪い) を 元に今後の回答精度を向上 させられる。 AI/BIダッシュボード AI/BI Genie 安全な回答を返却 企業データ アクセス ポリシー を適用 Unity Catalog GenieはUnity Catalogのアクセスポリ シーを遵守し、ユーザーがアクセス 可能なデータのみ を返却する。
  33. ©2025 Databricks Inc. — All rights reserved AI/BIを選ぶ理由 シンプルなアーキテクチャー AI/BIはデータプラットフォームの一部

    として統合されているため、別のデー タシステムや BIシステムの管理は不 要 AI/BIはユーザーのデータ資産や使 用パターン、ビジネスの概念に関す る深い知識 を持ち、関連性が高く正 確な回答を迅速に生成 AI/BI Genieは、ビジネスユーザーが ダッシュボードを超えて、自然言語を 使って新しいインサイトをセルフサー ビスで得られるようサポートする データを深く理解 より賢いセルフサービス 1 2 3
  34. ©2025 Databricks Inc. — All rights reserved Agenda 1. Databricksの全体像の紹介(15分)

    2. Unity Catalog & AI/BI 概要説明(15分) 3. ハンズオン(75分) ◦ Unity Catalog(15分) ◦ AI/BI ダッシュボード(30分) ◦ AI/BI Genie(30分) 4. アンケート・質疑応答(10分)
  35. ©2025 Databricks Inc. — All rights reserved ハンズオン : Unity

    Catatlog 1. Databricksワークスペースにログイン ◦ ログイン方法は参加者向け事前作業ガイド参照 2. 表示言語を日本語に変更 3. サンプルのテーブルを表示 ◦ カタログ: aibi_demo_catalog (又は当日指示) ◦ スキーマ: bricksmart ◦ テーブル: gold_user 4. サンプルのテーブルの各種情報を確認 ◦ どんなデータ が入っているか? ◦ いつ、誰に よって作られたか? ◦ 誰がデータを使用 できるか? ◦ テーブル/他データ資産との関係性は? 1. テーブルの説明 の鉛筆ボタンを 押してみましょう(説明を変更して もSaveを押さなければ反映され ません) 2. 列のコメント の鉛筆ボタンを押し てみましょう 3. transactions テーブルの 概要タブの「関係を表示 」 ボタンを押してみましょう 課題 追加課題 (時間があれば挑戦 )
  36. ©2025 Databricks Inc. — All rights reserved サンプルテーブルを表示 左側メニューのカタログをクリックし、 カタログ一覧で

    aibi_demo_catalog を クリック スキーマ一覧で bricksmart をクリック テーブル一覧で gold_user をクリック (時間があれば後で他のテーブルも参照してみましょう) ハンズオン操作例
  37. ©2025 Databricks Inc. — All rights reserved サンプルテーブルの各種情報を確認 サンプルデータタブ ハンズオン操作例

    補足1:「Genieに聞く」ボタンをクリックすると、自然言 語(日本語)でサンプルデータの内容を詳しく確認で きる 補足2:email列には「列レベルマスキング」を適用済 :管理者グループのみがマスキング前のメールアド レスを参照できる
  38. ©2025 Databricks Inc. — All rights reserved サンプルテーブルの各種情報を確認 参考:管理者グループのユーザーでの表示例 ハンズオン操作例

    管理者グループのユーザーが同じテーブルにアクセ スすると、マスキングされていないメールアドレスが 表示される
  39. ©2025 Databricks Inc. — All rights reserved テーブル/カラムの説明 AI生成コメントを利用可能 説明の右横の鉛筆アイコンをクリック

    ハンズオン操作例 ◇のアイコンをクリック 日本語で指示を書いて送信すると AIが生成したコメントが出力される • 承認を押すと反映される • 拒否を押すとキャンセル • 矢印を押すと再生成する
  40. ©2025 Databricks Inc. — All rights reserved Agenda 1. Databricksの全体像の紹介(15分)

    2. Unity Catalog & AI/BI 概要説明(15分) 3. ハンズオン(75分) ◦ Unity Catalog(15分) ◦ AI/BI ダッシュボード( 30分) ◦ AI/BI Genie(30分) 4. アンケート・質疑応答(10分)
  41. ©2025 Databricks Inc. — All rights reserved ハンズオン : AI/BIダッシュボード

    1. 空のダッシュボード を作成 • 名前例: EC分析ダッシュボード _山田太郎 • 使用するウェアハウス : Serverless Starter Warehouse または当日指示 • 2. ダッシュボードにテキスト を追加 • テキスト例: # 基本的な分析 • 3. ダッシュボードにデータセット を追加 • gold_user テーブルを選択 • 4. ダッシュボードにグラフを追加 1. 合計ユーザー数 2. 年齢層別ユーザー数 3. 性別別ユーザー数 4. 地域別ユーザー数 課題 5. ダッシュボードにフィルタ を追加 1. 年齢層 2. 性別 • 6. ダッシュボードを公開 • 7. クロスフィルタリング を試す • グラフの「シニア層」などをクリックし 他のグラフの変化を確認する
  42. ©2025 Databricks Inc. — All rights reserved ハンズオン : AI/BIダッシュボード

    1. ダッシュボードに新しいページ を追加 • 既存ページ名を基本などに変更する • 新規ページ名を応用などに変更し、 # 応用的な分析のテキストを追加する • 2. Databricks Assistantを活用して 以下のデータセット用のSQLを追加 1. 地域別・年齢層別のユーザー数 2. 年齢層別・地域別の平均食品購入点数 • 3. 2のデータセットを使ってグラフを作成 • 4. ダッシュボードを公開 追加課題 (時間があればチャレンジ ) 5. 公開済みダッシュボード上の Genieに聞くをクリックし、 何かしらの質問をしてみる • データセットについて日本語で説明して • シニア層の定義は? • 地域の例は?
  43. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 ダッシュボードにテキストを追加 >

    テキストボックスを追加をクリック マウスカーソルを動かして テキストボックスの配置場所を指定
  44. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 ダッシュボードにテキストを追加 >

    テキストを追加 テキストを追加後、テキストボックスの外側 の適当な場所をクリックする
  45. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 ダッシュボードにグラフを追加 >

    合計ユーザー数 のグラフのタイトルとレイアウトを調整
  46. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 ダッシュボードにフィルタを追加 >

    年齢層用のフィルタにするためフィールドで age_group を選択
  47. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 ダッシュボードを公開 >

    Genieを有効にしてください をオンにし、公開ボタンをクリック
  48. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 ダッシュボードを公開 >

    権限レベルに関する情報を確認、右上の × をクリックして閉じる
  49. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 ダッシュボードに新しいページを追加 >

    既存ページ名を変更、新規ページを追加 ダッシュボードの編集を行う際には、 公開から下書きに変更する必要がある
  50. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 地域別・年齢層別のユーザー数のデータセット作成 >

    gold_user のSQLをコピー & ペースト SQLから作成をクリックした後、gold_userデータセットの SQLをコピーして右側のクエリエディタに貼り付ける。 ※ Databricks Assistantはクエリエディタの内容を読み取 る。Databricks Assistantに正しいテーブル名を教えるの が目的。
  51. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 地域別・年齢層別のユーザー数のデータセット作成 >

    Databricks AssistantにSQL作成を指示 SELECT region, age_group, COUNT(*) AS user_count FROM aibi_demo_catalog.bricksmart.gold_user GROUP BY region, age_group ORDER BY region, age_group アシスタントが生成する想定の SQL ※ 異なるSQLが生成された場合、以下をコピー &ペーストして利用
  52. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 地域別・年齢層別のユーザー数のデータセット作成 >

    作成した SQLを反映 SELECT region, age_group, COUNT(*) AS user_count FROM aibi_demo_catalog.bricksmart.gold_user GROUP BY region, age_group ORDER BY region, age_group アシスタントが生成する想定の SQL ※ 異なるSQLが生成された場合、以下をコピー &ペーストして利用
  53. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 地域別・年齢層別のユーザー数のデータセット作成 >

    データセットの名前を変更 SQLの内容を元に、AIに データセットの名前を提案 させる(もちろん自分で名 前を入力してもOK)
  54. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 年齢層別・地域別の平均食品購入点数のデータセット作成 >

    同様の流れで実施 SELECT region, age_group, AVG(food_quantity) AS avg_food_quantity FROM aibi_demo_catalog.bricksmart.gold_user GROUP BY region, age_group ORDER BY region, age_group アシスタントが生成する想定の SQL ※ 異なるSQLが生成された場合、以下をコピー &ペーストして利用
  55. ©2025 Databricks Inc. — All rights reserved Agenda 1. Databricksの全体像の紹介(15分)

    2. Unity Catalog & AI/BI 概要説明(15分) 3. ハンズオン(75分) ◦ Unity Catalog(15分) ◦ AI/BI ダッシュボード(30分) ◦ AI/BI Genie(30分) 4. アンケート・質疑応答(10分)
  56. ©2025 Databricks Inc. — All rights reserved AI/BI Genieの基礎 •

    データチームがトピック固有の Genie スペースをセットアップします • ビジネスユーザーはGenieスペースでデータに対する質問への回答 を得られます • データインテリジェンスプラットフォームを活用し、 Genieは時間と共に学習します
  57. ©2025 Databricks Inc. — All rights reserved AI/BI Genieのセットアップのポイント 指示の追加

    精度の検証 • データチームは、一般的な 指示やサンプルのSQL文を 通じてGenieをガイド、教 育することができます • データチームや信頼できる ビジネスユーザーは、期待 される回答をテストするこ とができます • 指示に対して必要な改善を 行います フォーカスされた トピックとデータ • 1つのGenieスペースは1つの トピックにフォーカスします • 適切に文書化・整理された Unity Catalogのテーブル やビューを入力にします
  58. ©2025 Databricks Inc. — All rights reserved フォーカスされたトピックとデータ • Genieはどのようなデータの

    トピックにも対応できます • フォーカスしたデータセット を用意 します • 推奨:不要なカラムを除外し、デー タを整理したビューを作成します • Unity Catalogのテーブルやビュー に適切なコメントがあるとGenieの 回答精度が向上します
  59. ©2025 Databricks Inc. — All rights reserved 一般的な指示(General Instructions) •

    データチームは、一般的な指示 を通じてGenieに直接的なガイ ドを提供できます • 組織独自の専門用語やロジッ ク、コンセプト、 KPIなどを定 義します • 時間経過と共に指示を見直すこ とを推奨します あなたは日本における [データの名称]に関する日本人のエキスパートです。 与えられた質問に対して英語を使わずに日本語で回答します。 一般的な指示の例
  60. ©2025 Databricks Inc. — All rights reserved サンプルのSQL文 • データチームは、ユーザーから特定

    の質問が来た場合に使用する SQL文 をGenieスペースに定義できます • Genieとのやりとりの中で実際に 検証したSQL文を「指示として保 存」することで、Genieが今後の質 問に利用するようになります
  61. ©2025 Databricks Inc. — All rights reserved Genieによるフォローアップ • ユーザーからの質問が明確でな

    い場合、Genieはフォローアッ プや明確化するための質問 を行 うように設計されています
  62. ©2025 Databricks Inc. — All rights reserved 1. Genieスペースを作成 •

    Title例: EC分析スペース_山田太郎 • Default warehouse: Serverless Starter Warehouse または当日指示 • Tables: aibi_demo_catalog > bricksmart スキーマの全テーブルを選択 • 2. 商品のカテゴリー の理解 • ブリックスマートの商品のカテゴリーをGenieに 聞く • 回答が英語の場合、日本語で回答するように Genieに指示を追加する • 3. 商品のサブカテゴリー の理解 ハンズオン : AI/BI Genie 課題 4. 回答にフィードバック を付与 • Good/Badを付与 • 管理者にレビューリクエストを送信 • 5. スペース設定の更新 • 説明とサンプル質問を追加 • 6. スペースの共有 • ワークスペースのユーザーに作成した Genieスペースを共有
  63. ©2025 Databricks Inc. — All rights reserved ハンズオン : AI/BI

    Genie 1. 地域の傾向 を分析(以下は観点の例) • ユーザーがいる地域 • 東京と大阪のカテゴリー別の売上金額と割合 • 東京と大阪のカテゴリー別の購買客数・客単価・ 購買頻度 • 2. 年齢層の傾向 を分析 • ユーザーの年齢層 • 年齢層ごとのカテゴリー別の売上金額と割合 • シニア層と中年層の食料品の売上構成の差 追加課題 (時間があればチャレンジ ) 3. 更に時間があれば自由に質問 を行い データの隠れた傾向 を炙り出す 以下は分析軸の例 • 性別ごとの傾向 • 組み合わせによる傾向 i. 若年層の地域別の傾向 ii. vシニア層の地域別の傾向
  64. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 Genieスペースを作成 >

    タイトルとウェアハウスを選択し、テーブルを追加をクリック
  65. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 Genieスペースを作成 >

    カタログとして aibi_demo_catalog を選択(表示されない場合は検索する)
  66. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 Genieスペースを作成 >

    bricksmart スキーマのすべてのテーブルを選択し、確認をクリック
  67. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 商品のカテゴリーの理解 >

    Genieに質問: ブリックスマートのカテゴリーおよびサブカテゴリーについて教えて
  68. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 商品のカテゴリーの理解 >

    カテゴリーとサブカテゴリーが表示される(※ 回答文が英語で返ってくる場合がある)
  69. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 商品のカテゴリーの理解 >

    メニューから指示を選び、 日本語で回答して などと記載し、 Saveをクリック
  70. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 商品のカテゴリーの理解 >

    Genieに質問: 商品のカテゴリーごとの売上金額を教えて、多い順で並べて
  71. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 商品のサブカテゴリーの理解 >

    Genieに質問: 商品のサブカテゴリーごとの売上金額を教えて、多い順で並べて
  72. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 回答にフィードバックを付与 >

    直近の回答のいいねをクリック、左メニューから履歴 (History) を選択
  73. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 回答にフィードバックを付与 >

    以前の回答のハテナマークをクリック、適当なコメントを入力して送信
  74. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 回答にフィードバックを付与 >

    履歴ページでリクエストを確認、レビュー済みとしてマーク
  75. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 スペース設定の更新 >

    左メニューで設定をクリックし、説明 (Description) を更新
  76. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 スペース設定の更新 >

    サンプル質問を追加: ブリックスマートの商品のカテゴリとサブカテゴリは?
  77. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 スペース設定の更新 >

    チャットに戻り、追加したサンプル質問をクリック
  78. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 スペースの共有 >

    適当なユーザーをクリック(ここではすべてのワークスペースユーザーを選択)
  79. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 地域の傾向を分析 >

    質問例: 東京と大阪のカテゴリーごとの売上金額と割合 東京と大阪の結果がまと められてしまう場合がある
  80. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 地域の傾向を分析 >

    東京と大阪を分けて出力するように指示を追加 東京と大阪の結果が分け て表示される
  81. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 地域の傾向を分析 >

    質問例: 東京と大阪のカテゴリー別の購買客数・客単価・購買頻度を出力して
  82. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 年齢層の傾向を分析 >

    質問例: ユーザーの年齢層ごとのカテゴリー別の売上金額を高い順で出力
  83. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 年齢層の傾向を分析 >

    質問例: ユーザーの年齢層ごとのカテゴリー別の売上金額と比率
  84. ©2025 Databricks Inc. — All rights reserved ハンズオン操作例 年齢層の傾向を分析 >

    質問例: シニア層と中年層の食料品の売上構成の違い、年齢層・売上金額の多い順で出力
  85. ©2025 Databricks Inc. — All rights reserved Agenda 1. Databricksの全体像の紹介(15分)

    2. Unity Catalog & AI/BI 概要説明(15分) 3. ハンズオン(75分) ◦ Unity Catalog(15分) ◦ AI/BI ダッシュボード(30分) ◦ AI/BI Genie(30分) 4. アンケート・質疑応答( 10分)
  86. ©2024 Databricks Inc. — All rights reserved ワークショップのゴール • Databricksによるデータ分析の新しい可能性を理解する

    • • AIを活用したデータ分析手法の効果を体感する • • 自社のデータ分析業務の改革に向けたヒントを得る 1 2 3