Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データ分析エージェント Socrates の育て方

Avatar for na0 na0
September 17, 2025

データ分析エージェント Socrates の育て方

メルカリでのAI Agentの現在地を大公開っ
https://mercari.connpass.com/event/366804/

Avatar for na0

na0

September 17, 2025
Tweet

More Decks by na0

Other Decks in Technology

Transcript

  1. 2 Agent Engineer / Mercari BI Product Google Developer Expert

    (Google Cloud) Naofumi Yamada @na0fu3y
  2.    Japan Region Mercari Group Fintech 4 会社概要 メルカリグループは、株式会社メルカリと、その連結子会社で構成されています。 Marketplace

    株式会社メルカリ ◼設立 ◼事業内容 ◼所在地 ◼拠点 ◼代表執行役 CEO ◼執行役 SVP of Japan Region ◼執行役員 CEO Marketplace     2013年2月1日     スマートフォン向けフリマアプリ     「メルカリ」の企画・開発・運営     〒106-6118 東京都港区六本木6-10-1     六本木ヒルズ森タワー     東京、福岡、大阪     山田進太郎     山本真人     迫俊亮 ①2017年11月20日 ②金融事業 ③永沢岳志 株式会社メルペイ ①2014年1月 ②US版メルカリの企画・開発・運営 ③山田進太郎 ④Palo Alto, California Mercari, Inc.(US) ①1991年10月1日 ②フットボールクラブ運営 ③小泉文明 ④茨城県立カシマサッカースタジアム 指定管理茨城県鹿嶋市 粟生東山2887番地 株式会社鹿島 アントラーズ・エフ・シー インド開発拠点 ①2022年6月 ②インターネットサービス開発 ③Carlos Donderis(取締役 Managing Director) ④Bangalore, Karnataka, India Mercari Software Technologies India Private Limited ①2021年4月28日 ②暗号資産・ブロックチェーン ③中村奎太 株式会社メルコイン ①設立 ②事業内容 ③CEO ④所在地
  3. 9 データ分析 LLM エージェント Socrates Chat / Deep Research 形式で

    データ分析を⾏う LLM エー ジェントを開発中 累計 1,000 ⼈以上が利⽤
  4. やること:壁を越える機能をつくる! 壁 機能 0. 課題意識 LLM が SNS / 社内

    Slack / KPI から課題を理解 1. データ選択 LLM がデータカタログから検索 2. 権限申請 LLM が社内ドキュメントから検索 3. データ理解 LLM がメタデータを閲覧 4. 分析設計 LLM が分析仕様書 Analytics Design Doc を記述 5. SQL 理解 LLM が仕様にあった SQL を記述
  5. やること:壁を越える機能をつくる! 壁 機能 0. 課題意識 LLM が SNS / 社内

    Slack / KPI を評価 1. データ選択 LLM が データカタログから検索 2. 権限申請 LLM が 社内ドキュメントから検索 3. データ理解 LLM が メタデータを閲覧 4. 分析設計 LLM が 分析仕様書 ADD を記述 5. SQL 理解 LLM が 仕様にあった SQL を記述 LLM にやってもらわなきゃいけないこと多くない...?どうやって実装しよう
  6. 16 LLM エージェント ≒ LLM + ツール ツール LLM •

    外部⼊出⼒ • 構造化データ処理 • 思考 • ⾮構造化データ処理
  7. LLM エージェントフレームワーク SELECT 1 を実⾏して SELECT 1 を実⾏して {“call”: “execute_sql”,

    “query”: “SELECT 1”} SELECT 1 を実⾏して SELECT 1 を実⾏して {“call”: “execute_sql”, “query”: “SELECT 1”} {“response”: “execute_sql”, “rows”: [[1]]} SELECT 1 を実⾏して {“call”: “execute_sql”, “query”: “SELECT 1”} {“response”: “execute_sql”, “rows”: [[1]]} 結果は 1 だったよ 結果は 1 だったよ AI エージェント フレームワーク ツール呼び出し / 会話履歴などを簡単に実装できる仕組み
  8. やること:壁を越える機能をつくる! 壁 機能 関連するリソースの例 0. 課題意識 LLM が SNS /

    社内 Slack / KPI を評価 BigQuery、Slack 1. データ選択 LLM が データカタログから検索 Dataplex Universal Catalog、GitHub 2. 権限申請 LLM が 社内ドキュメントから検索 Confluence、Google Drive 3. データ理解 LLM が メタデータを閲覧 BigQuery 4. 分析設計 LLM が 分析仕様書 ADD を記述 - 5. SQL 理解 LLM が 仕様にあった SQL を記述 - ツールとして何をどう実装しよう?
  9. ツールを借りる / つくる 信⽤できる MCP を使う、ない場合や固有の制約が欲しい場合は⾃作する リソース 必要な機能 固有の制約 BigQuery

    • クエリの実⾏ • description の閲覧 1TB 以上参照するクエリは承認制 にしたい Dataplex Universal Catalog • BigQuery テーブルの検索 (信⽤できる MCP がない) Slack • 最近のメッセージの閲覧 GitHub • 関連ソースコードの検索 Confluence • ドキュメントの検索 • ドキュメントの閲覧 Google Drive • ドキュメントの検索 • ドキュメントの閲覧
  10. その前に:どうやって評価する? どうなったら嬉しいか、終了条件を満たすかを定義する 例) • 利⽤者の評価 👍 / 👎 を最⼤化する ◦

    ⼈間の介⼊回数が少ない ◦ 最⼩クエリ発⾏数で要件を満たすレポートが⽣成される • ベンチマーク⽤のデータセットに対して 95% の精度を達成する
  11. プロンプト品質...? LLM の⼊⼒には以下のような種類がある。全ての品質を考慮できるとよい。 ⼊⼒ 機能 責務 システムプロンプト エージェントの役割、性格、⾏動指針、制約など 開発者 ユーザプロンプト

    ユーザからの具体的な質問や指⽰など 利⽤者 ツール説明⽂ エージェントが利⽤できるツールの機能、使い ⽅、引数、出⼒形式など 開発者 ツール出⼒ ツールを実⾏して返ってきた情報など 開発者 LLM 出⼒ LLM 返答した情報など 開発者
  12. 次にやること:⼈間の体験をシームレスに 壁の越え⽅ 1 つ 1 つを繋ぎ合わせて、利⽤者体験を⼀貫性のあるものに 壁 機能 0. 課題意識

    LLM が SNS / 社内 Slack / KPI を評価 1. データ選択 LLM がデータカタログから検索 2. 権限申請 LLM が社内ドキュメントから検索 3. データ理解 LLM がメタデータを閲覧 4. 分析設計 LLM が分析仕様書 Analytics Design Doc を記述 5. SQL 理解 LLM が仕様にあった SQL を記述