Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data & AI Summit ’25 Spring 登壇資料 データの見えない糸を紡ぐ:L...

Data & AI Summit ’25 Spring 登壇資料 データの見えない糸を紡ぐ:LLMを活用したLookerとdbtによるメタデータ戦略

More Decks by LegalOn Technologies, Inc

Transcript

  1. 4 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. <Purpose>

    法とテクノロジーの力で、 安心して前進できる社会を創る。 LegalOn Technologies 会社紹介 株式会社LegalOn Technologiesは、AI×リーガルのグローバルカンパニーです。 弁護士の法務知見と自然言語処理技術や機械学習などのテクノロジーを組み合わせ、 法務業務のイノベーションを推進するサービスを開発・提供しています。 会社名 株式会社LegalOn Technologies 設立 2017年4月21日 従業員数 599名(役員含む/2025年4月時点) 資本金 178.5億円(資本準備金等含む) 所在地 〒150-6219 東京都渋谷区桜丘町1-1 渋谷サクラステージSHIBUYAタワー19F
  2. 5 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. サービスの紹介

    法務業務 学習支援 契約業務 経営・コーポレート支援 AIレビューサービス ※LegalOn Technologies 米国法人が提供 オンライン法務学習支援サービス AI契約管理システム 契約学習メディア「契約ウォッチ」 AIカウンセル 法務・契約業務支援
  3. 7 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. source

    staging intermediate mart 1. データソースに準拠した生テーブル 2. リネームやキャスト等の加工を施したテーブル 3. 複雑な結合や集約を使用する非公開の中間テーブル 4. ビジネスモデルに即した公開テーブル dbtとデータレイヤー dbt Best practice guides: https://docs.getdbt.com/best-practices
  4. 8 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. Lookerの役割

    : データマート公開 : データモデリングとガバナンス : モダンなBIとデータ探索 dbtで作成したモデルを利用者へ公開 共通のインターフェースでデータ分析・探索・可視化を実現 LookMLによるデータモデリングと公開範囲の管理
  5. 9 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. Lookerの利用実績

    幅広い部署での活用 多様な用途 セキュリティ対応 利用部門は人事・労務を除く全ての部門が使用 各種プロダクトのKPIやマーケティングファネ ルなど幅広く利用 社内のセキュリティレベルに応じて公開データ を制限、ガバナンスに貢献
  6. 17 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. メタデータ伝搬の課題

    ①: メタデータのソースデータ上での入力コスト ②: dbtで定義するyamlへの入力コスト ③: LookMLの各種定義の反映コスト 開発者サイドの協力・啓蒙 ソースデータからLLMで自動入力・伝搬 dbtをソースにLookMLを自動生成 Pull Request 自動作成
  7. 21 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. スキーマ情報でGeminiを活用:

    descriptionの長さ調整 Looker上で表示されるLabel名の長さの問題 descriptionの文字列が長く、BigQuery上は問題なくとも、 LookerのExploreで表示すると見辛い Label名と詳細情報の分割 2種類のデリミタ:に分割し、Labelと詳細情報で分けて出力 [ID: ユーザーIDを設定する user_id or user_group_id] Label名
  8. 22 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. dbt-osmosisによるソースデータからの伝搬

    dbt-osmosis: yamlのメタデータを伝搬させるdbt package 1. source - staging - martと利用者へ公開するプロセスでdescription やセキュリティラベル(Policy Tag)のデータを自動伝搬させる 2. GitHub上にPRを作成したタイミングで、GitHub Actionsが発火。 変更箇所のリファクタリングが稼働し、descriptionを書き換える
  9. 23 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. LookMLへの伝搬コスト

    Viewだけでも数千個存在するので LookMLの更新が面倒 • dbtのmartで公開したテーブルをLookMLで書き直す ◦ View、Explore、dimension、measureを作成する • 変更処理はデータベースだけでなく、ログなど多岐にわ たる ◦ 毎日発生する可能性のあるタスクである
  10. 24 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. dbt

    to LookMLの自動生成 Vertex AI source staging mart LookML/ Looker Geminiで sourceに反映 LookML に反映 dbtのmodel、yamlとLookMLを自動生 成するスクリプトでPRまで自動生成 PRを生成して、レビュワーがチェック 1. dbtのmodel、yamlの生成 2. ソースデータのメタデータ追従 3. 型変更等の破壊的変更の検知 4. Policy Tagの伝搬 5. martをベースにしたLookMLの生成 6. Pull Requestの作成
  11. 27 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. 破壊的変更に対するアプローチ

    ログやデータベースが開発の影響で破壊的変更が発生し、 テーブル構造が壊れる可能性がある 現在 将来 スキーマをチェックし、破壊的変更がデータソース側の環境で発生する場合は、 差分をチェックして検知。ただし後手の対応で運用コストが高い 破壊的変更が発生するバージョンごとにテーブルを生成し、バージョンごとに分割 したテーブルを結合させる、等自動化の仕組みづくりを進めている
  12. 28 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. 今後の展望

    ①: 開発プラクティスのさらなる効率化 ②: AIによるデータインサイトの提供 ③: データ品質の向上 • データマネジメントチームが介入せずともデータをメンテナンス・分析できる状態にする • 各種メタデータの集約ができる状態になったので、他のメタデータも含め、MCPサ ーバーとの連携を強め、データ利用者に簡単にインサイトを提供する • dbt ElementaryやOpenMetadataを導入し、有効活用している • データオブザーバビリティのプラクティスを充実させ、他組織へ横展開していく
  13. 29 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に供される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. まとめ

    メタデータの管理は非常に面倒だが、 収集することで様々な用途での利用価値がある 1. データプロデューサー側の組織との連携は不可欠である 2. LLMを使用することでプロセスを自動化・効率化できる 1. データを活かすためには、人間だけでなく、 AIが利用できる状態を作ることが極めて重要である