Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データエージェントのためのナレッジカタログ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
na0
May 25, 2026
2.2k
4
Share
データエージェントのためのナレッジカタログ
2026-05-25 データ利活用分科会 #33
https://jaguer.connpass.com/event/392373/
na0
May 25, 2026
More Decks by na0
See All by na0
データ活用 3.0 with Socrates
na0
2
2.1k
AI 時代のデータ戦略
na0
8
6k
adk-samples に学ぶデータ分析 LLM エージェント開発
na0
3
1.7k
BigQuery でできること、人間がやるべきこと
na0
0
1.3k
データ分析エージェント Socrates の育て方
na0
10
6.7k
AI エージェントと考え直すデータ基盤
na0
26
13k
メルカリにおけるデータアナリティクス AI エージェント「Socrates」と ADK 活用事例
na0
29
35k
BigQuery リリースノート - 2023年上半期 #bq_sushi
na0
3
510
2023 年の BigQuery 権限管理
na0
5
3.4k
Featured
See All Featured
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
290
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
410
Thoughts on Productivity
jonyablonski
76
5.2k
New Earth Scene 8
popppiees
3
2.2k
Abbi's Birthday
coloredviolet
2
7.6k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.3k
Tell your own story through comics
letsgokoyo
1
930
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
400
Joys of Absence: A Defence of Solitary Play
codingconduct
1
370
A better future with KSS
kneath
240
18k
Navigating Team Friction
lara
192
16k
Transcript
1 データエージェントのためのナレッジカタログ 2026-05-25 データ利活用分科会 #33 na0
2 メルカリ Japan Business Data Google Developer Expert (Cloud) na0
Japan Region Mercari Group Fintech 3 会社概要 メルカリグループは、株式会社メルカリと、その連結子会社で構成されています。 Marketplace
株式会社メルカリ ◼設立 ◼事業内容 ◼所在地 ◼拠点 ◼代表執行役 CEO ◼執行役 SVP of Japan Region ◼執行役員 CEO Marketplace 2013年2月1日 スマートフォン向けフリマアプリ 「メルカリ」の企画・開発・運営 〒106-6118 東京都港区六本木6-10-1 六本木ヒルズ森タワー 東京、福岡、大阪 山田進太郎 山本真人 迫俊亮 ①2017年11月20日 ②金融事業 ③永沢岳志 株式会社メルペイ ①2014年1月 ②US版メルカリの企画・開発・運営 ③山田進太郎 ④Palo Alto, California Mercari, Inc.(US) ①1991年10月1日 ②フットボールクラブ運営 ③小泉文明 ④茨城県立カシマサッカースタジアム 指定管理茨城県鹿嶋市 粟生東山2887番地 株式会社鹿島 アントラーズ・エフ・シー インド開発拠点 ①2022年6月 ②インターネットサービス開発 ③Carlos Donderis(取締役 Managing Director) ④Bangalore, Karnataka, India Mercari Software Technologies India Private Limited ①2021年4月28日 ②暗号資産・ブロックチェーン ③中村奎太 株式会社メルコイン ①設立 ②事業内容 ③CEO ④所在地
2013年2月1日 会社設立日 東京、福岡、大阪 Palo Alto、Bangalore オフィス 2,190名(連結) 従業員数 4
株式会社メルカリ 概要
5 データエージェント Socrates 自然言語でデータを扱える LLM エージェント Web / A2A 環境
550+ MAU
6 高額な「検証税」を節税するには …? 生成 AI で節約した時間のうち 4 割が手戻りで失われる 37 %
https://forms.workday.com/en-us/reports/beyond-productivity-ai-value/form.html Beyond Productivity: Measuring the Real Value of AI
7 データ環境の複雑さ、曖昧さ、が主な原因 データ業務における「検証税」の正体 https://arxiv.org/abs/2411.07763 Spider 2.0: Evaluating Language Models on
Real-World Enterprise Text-to-SQL Workflows 27.6 % テーブル / 列選択の誤り 35.5 % 多段クエリ / 高度な計算の誤り 11.5 % 行選択の 誤り 8.3 % 結合の 誤り 7.4 % 構文 エラー 4.7 % ナレッジ の誤解 5.1 % コンテキ スト限界
8 Socrates の現在地
9 BigQuery Socrates の技術要素 Web / MCP / A2A Google
ADK Gemini Skills Tools LLMs Looker Vector Search その他
10 Socrates Skills : 多段クエリ / 高度な計算を支援する 複雑な CTE、新しい BigQuery
関数の記述を支援する Agent Skills を提供
11 ナレッジの読み書きツールを Web / MCP で提供 主なドキュメント • Looker /
BigQuery に 未実装のルール • 社内固有の概念 • 歴史的経緯 • ガバナンスルール Socrates Knowledge : テーブル / 列 / 行選択を支援
12 Socrates Resource Catalog : コンテキストの最小化 project dataset users transactions
dataset_b payments 階層構造の API users transactions payments フラットなカタログで効率化
13 これまでの取り組みで 一部領域の「検証税」を抑制する 仕組みができつつある 「検証税」の 90% 抑制を目指す https://arxiv.org/abs/2411.07763 Spider 2.0:
Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows 27.6 % テーブル・ 列選択の誤り 35.5 % 多段クエリ・ 高度な計算の誤り 11.5 % 行選択の 誤り 8.3 % 結合の 誤り ✅ 5.1 % コンテキ スト限界 7.4 % 構文 エラー 4.7 % ナレッジ の誤解
14 Socrates のこれから
15 問題:品質と網羅性を両立できない AI 時代の機動性 を組織に導入するために、このトレードオフから脱却したい 品質 網羅性 既存レポート 定形外クエリ 定型クエリ
Socrates Knowledge トレードオフ
16 小問題:書き手が品質を管理できない 構造の問題をエージェントで解消し、誰でもナレッジに貢献できる仕組みへ 現状 理想 • 書き手の負担が大きい • 新人が参加しにくい •
特定の場所 / ルールへの依存 • 書きたい時に書く (人 & AI) • 誰でも参加しやすい • どこに書いても参画できる 執筆 検証 ナレッジ 執筆 生ナレッジ 検証 ナレッジ 司書 エージェント
17 Socrates Knowledge v2 ingest : 取り込み query : 検索
compile : 構造化 lint : 検証 deprecate : 破棄 raw sources Wiki https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f LLM Wiki 司書 エージェント
18 Socrates Knowledge v2 - compile 生ナレッジ • 個人メモ •
チーム固有の概念 • 歴史的経緯 • BigQuery descriptions … compile : 構造化 構造化ナレッジ「主張」 名前 : GMV 定義 : メルカリの取引総額 計算式 : SUM(price) WHERE status=’complete’ 参考文献 notion.so/xxx slack.com/yyy 異なる定義の用例 …
19 Socrates Knowledge v2 - lint 構造化ナレッジ「主張」 名前 : GMV
定義 : メルカリの取引総額 計算式 : SUM(price) WHERE status=’complete’ 証拠 notion.so/xxx slack.com/yyy 異なる定義の用例 … lint : 評価 lint score • 矛盾はないか • Raw sources の提案 • 過剰な推論はないか • 証拠能力 • 証拠の鮮度 ...
20 司書エージェントの導入で 全領域の「検証税」抑制へ 全ての「検証税」の抑制する https://arxiv.org/abs/2411.07763 Spider 2.0: Evaluating Language Models
on Real-World Enterprise Text-to-SQL Workflows 27.6 % テーブル・ 列選択の誤り 35.5 % 多段クエリ・ 高度な計算の誤り 11.5 % 行選択の 誤り 8.3 % 結合の 誤り ✅ 5.1 % コンテキ スト限界 7.4 % 構文 エラー 4.7 % ナレッジ の誤解
21 データ業務の完全自動運転を目指して 「検証税」がなくなると、より遠くへ自走できる Level 2 現在地 人が運転席 Agent は助手席 「これ調べて」
→ Agent が回答 Level 3 これから Agent が運転席 「こんな仮説あるけど」 → 「すでに調べてあるよ」 「この情報考慮して」 →「新情報を発見したよ」