Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DAIS 2025 で感じた データ + AI の“イマ”

Avatar for Takaya Nakanishi Takaya Nakanishi
July 20, 2025
230

DAIS 2025 で感じた データ + AI の“イマ”

2025/07/18(金) に行われた JEDAI のイベント『 Data + AI Summit 2025をみんなで振り返ろう!』での発表資料です。本資料の内容は発表者個人の見解であり、所属組織の公式見解を示すものではありません。

Avatar for Takaya Nakanishi

Takaya Nakanishi

July 20, 2025
Tweet

More Decks by Takaya Nakanishi

Transcript

  1. © 2025/7/20 Knowledge Communication Co., Ltd. Knowledge Communication Co.,Ltd. DAIS

    2025 で感じた データ + AI の“イマ” 2025 年 7 月 18 日 JEDAI Meetup Data + AI Summit 2025 をみんなで振り返ろう!
  2. © 2025/7/20 Knowledge Communication Co., Ltd. 12 2024 年の Data

    Inteligence オープンで統一されたデータ基盤 Data Lakehouse Generative AI データとAIの拡張と活用を容易にする Data Intelligence データ+AIを組織全体で共有する
  3. © 2025/7/20 Knowledge Communication Co., Ltd. 13 2025 年の Data

    Inteligence Unity Catalog 標準化 データ取込を 加速させる 積極的な AI での活用 業界ニーズ に最適化 DWH として 標準化 DWH として 標準化 Data Intelligence
  4. © 2025/7/20 Knowledge Communication Co., Ltd. 15 機能強化の捉え方 AI :

    LLM (GPT , Claude , Gemini) 頭 : AI モデル/データの制御 (ガバナンス) 腕 : 連携し作業 (MCP + Agent 化) 足 : AI・データを運ぶ (パイプライン) 体 : データの蓄積 (DataLake , DWH)
  5. © 2025/7/20 Knowledge Communication Co., Ltd. 21 機能強化の捉え方 AI :

    LLM (GPT , Claude , Gemini) 頭 : AI モデル/データの制御 (ガバナンス) 腕 : 連携し作業 (MCP + Agent 化) 足 : AI・データを運ぶ (パイプライン) 体 : データの蓄積 (DataLake , DWH)
  6. © 2025/7/20 Knowledge Communication Co., Ltd. 23 AI との向き合い方の変化 AI

    に対する姿勢 なんでもいい感じ でやってよ~。
  7. © 2025/7/20 Knowledge Communication Co., Ltd. 24 AI との向き合い方の変化 お祈りする側から管理側へ

    貴方は AI だと思いますがエー ジェント同士のやりとり全部ちゃ んと監査ログ取れててアクセス制 御は細かくできててIDの伝搬もさ れてて誰が何使ったかデータリ ネージュ追えてますか?ゼロトラ スト前提で不要なデータは渡して ないよね?Feature Storeとかもガ バナンス効いてる?それとも全部 人が最終確認してる?その辺のポ リシーちゃんと強制されてる設計 になってますか?!
  8. © 2025/7/20 Knowledge Communication Co., Ltd. 25 AI との向き合い方の変化 1.

    Access Control 2. Data Lineage 3. Audit Logging 4. Fine-grained Permissions 5. Policy Enforcement 6. Data 7. Identity 8. Zero Trust 9. Governed Feature Store 10.Human-in-the-loop お祈りする側から管理側へ
  9. © 2025/7/20 Knowledge Communication Co., Ltd. Data + AI Summit

    2025 から戻ってきてやってること 28
  10. © 2025/7/20 Knowledge Communication Co., Ltd. 30 (参考資料) Databricks を中心とした

    LLM セキュリティデータ基盤 Unity Catalog + MLflow をベースとした国内ガイドライン要件への対応システム # ガイドライン要件 具体的なアプローチ エビデンス担保・監査方法 (案) 1 経営層の基本方針 (AI事業者GL 2) 組織レベルの Unity Catalog 〈Metastore/Workspace〉を “Single Source of Truth(SSOT)” とし、Catalog 権限を経営レベルと合意し初 期設定。Governance Policy Doc をΔテーブルに保管し Lineage で変更履 歴を追跡 UC の System Tables.audit ログで権限変更を証跡化 2 品質マネジメント体制 (産総研 GL 3.1) MLflow Registry に “Validation” ステージを追加し、モデル毎に 品質判 定タグを必須化、UC の Catalog Tag に「QA_PASSED」 「QA_PENDING」を同期 MLflow イベントを Unity Lineage と紐づけ、監査ログで段階移行を自 動記録 3 リスクアセスメント (AI事業者GL 3.2) Feature Store 内に “リスクスコア列” を持たせ、Delta Constraint でし きい値超過をブロック、重大リスクモデルは Separate Catalog + Row ACL で隔離 Delta Constraint 失敗イベントを Unity Catalog.system.events に蓄 積し、BI ダッシュボードで可視化 4 データガバナンス (産総研 GL 4.1, AI事業者GL 付属) 個人情報テーブルに Row- & Column-Level Security を適用 External Location による BYOB ストレージ分離(JP/EU/US) Lineage Graph で下流利用を追跡し「個人データフロー図」を自動出力 5 透明性・説明責任 (両GL 共通) MLflow Trace で推論リクエスト/レスポンス・プロンプト・最終回答を 90 日保管、Unity Catalog Managed Tables にログを保存し、Auto-Desc で Schema を公開 UC Table Comment に「説明用メタ情報」を付与、追跡番号を生成 6 モニタリング & 継続的改善 (産総研 GL 5.2) Unity Catalog Lineage + SQL Alerts でモデル性能/バイアス指標劣化を 監視。Databricks Jobs で定期再学習パイプラインを UC 下に配置 Alert 発報ログを System Tables.alert_history に保存、監査に提出 7 外部規制との整合 (EU AI Act, NIST RMF も引用) Catalog カスケード権限で “高リスク” モデルをリージョン別に完全分離 ガバナンス設定を Terraform + Unity Catalog Provider で Infrastructure-as-Code 化 CI/CD で Terraform 変更差分を PR に残し、Git コミットが法令証跡 ※産総研 「生成AI品質マネジメントガイドライン」 & 経産省 「AI事業者ガイドライン」への準拠マップを元に弊社が作成 1. ポリシーモデル化 導入ステップ (案) 2. PoC (概念検証) 3. 公開前レビュー 4. 本番運用 ガイドライン条項 → UC オブ ジェクト/権限に対応表を作成 2-3のアプリで①-⑥を確認し、 証跡の一元化を確認 UC System Logs から適合性を 最終確認 四半期ごとに Lineage Graph からレポートを作成し監査対応 Unity Catalog と Mlflow を組み合わせた 国内の生成 AI ガイドラインへ準拠する環境の標準化