Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CodeAgentとMCPで実現するデータ分析エージェント
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
CyberAgent
PRO
May 27, 2025
580
1
Share
CodeAgentとMCPで実現するデータ分析エージェント
CyberAgent
PRO
May 27, 2025
More Decks by CyberAgent
See All by CyberAgent
マッチングアプリにおけるユーザー構成の変化は、事業KPIにどう影響しているのか
cyberagentdevelopers
PRO
1
38
Geo-Experiments : ABEMAはなぜ新しい宣伝の効果検証にチャレンジするのか
cyberagentdevelopers
PRO
2
460
ABEMA NEWSにおける PoCをAIプロダクト化する ビジネスリードエンジニアリング
cyberagentdevelopers
PRO
0
320
チーム開発の基礎_研究を事業につなげるために
cyberagentdevelopers
PRO
8
4.8k
生成AIの研究活用_AILab2025研修
cyberagentdevelopers
PRO
12
7.1k
生成AIを活用したデータ分析でいまできること
cyberagentdevelopers
PRO
2
440
IBC 2025 動画技術関連レポート / IBC 2025 Report
cyberagentdevelopers
PRO
2
490
2025年度 生成AI 実践編
cyberagentdevelopers
PRO
8
1.1k
LLMを用いたメタデータベースレコメンド検証
cyberagentdevelopers
PRO
6
2.3k
Featured
See All Featured
What's in a price? How to price your products and services
michaelherold
247
13k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
300
Docker and Python
trallard
47
3.8k
Being A Developer After 40
akosma
91
590k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
180
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
64
53k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
How to Think Like a Performance Engineer
csswizardry
28
2.5k
エンジニアに許された特別な時間の終わり
watany
106
240k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
200
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
400
Transcript
CodeAgentとMCPで実現 するデータ分析エージェン ト 村脇 光洋 CA DATA NIGHT #6
自己紹介 村脇 光洋 職種:サーバーサイド 所属 : AI事業本部 アプリ運用カンパニー ➡ AI
POS カンパニー (2025/1~) 業務内容: ◦ 小売業/メーカー向けデータ分析SaaS開発 2
Table of Contents 1. プロダクト紹介「AI POS」 2. 事例紹介 : 分析コンテンツの開発速度を向上させるLLM利用
3. LLM領域の技術選定 3
プロダクト紹介「AI POS」 4
AI POS とは? 5
AI POS とは? 6 メールレポート チャット 小売業・製造業の方に 情報を提供
AI POS の システム構成 7 メール レポート チャット 多くの分析メニュー
ユーザの質問に応じた分析を、 LLMによる生成は行っていない (データの正確性が求められるため) AI POS におけるLLMの活用ポイント 8 メール レポート チャット
多くの分析メニュー
AI POS におけるLLMの活用ポイント 9 多くの分析メニュー 分析メニュー開発をLLMエージェントで高速化
分析コンテンツの開発速度を向上させる LLM利用 10
LLMを利用した分析メニュー開発のフロー 11 ① 分析エージェントを利用して分析メニューの プロトタイプを作成する ② Cursorで事前定義済み(mdc)の設計パターン に則ってプロトタイプをプロダクションコード化 ③ 人間がチェック・修正。品質を担保
LLMを利用した分析メニュー開発のフロー 12 ② mdcファイルに事前定義済みの設計パターン に則ってプロトタイプをプロダクションコード化 ③ 人間がチェック。品質を担保 ① 分析エージェントを利用して分析メニューの プロトタイプを作成する
今回はこの分析エージェントの話をします
分析エージェント(実際のUI) 13 プロファイル(利用ツールなどエージェント設定)選択 プロファイル(利用ツールなどエージェント設定)選択 ツール群(MCPなどで連携)選択 分析定義 入力
分析エージェント(実際のUI) 14 カテゴリ情報 step1: カテゴリ情報取得 ※一部情報をマスクしています
分析エージェント(実際のUI) 15 ※一部情報をマスクしています step2: Queryを記述して データを取得
分析エージェント(実際のUI) 16 ※一部情報をマスクしています step3,4: 取得したデータを 加工して可視化
分析エージェントの効果 17 • 分析メニューの開発工数を1/3以下に圧縮 • 最終アウトプットを事前にメンバーが見ながら議論ができる • PMなど、開発メンバー以外でも分析メニューの作成ができる
分析エージェントの構成 18
分析エージェントの構成 19 エージェントの実装について
エージェントの実装 20 • フレームワークにHugging Face社の「smolagents」を採用 • 特徴 ◦ 動作原理にCodeActを採用 ◦
最小限の機能。ワークフローが組めない ◦ MCP対応 ◦ OpenTelemetry準拠 ◦ LLMモデルの切り替えが容易(litellm)
smolagentsの特徴 : CodeAct 21 関連 ReAct: https://arxiv.org/abs/2210.03629, CodeAct: https://arxiv.org/abs/2402.01030 (画像はCodeActの論文より引用)
従来のエージェントは、ツールとツールの繋ぎ込みに課題があった • 既存アプローチではjsonがtoolの インターフェース • toolの結果が、別のtoolへと渡さ れる時に欠損する • 扱う値の変換も容易ではない • CodeActはツール呼び出しを Python上で行うことで、それら の課題を解決
smolagentsの特徴 : CodeAct 22 具体例 : 先の分析の例 step2 sqlを実行し、結果を result変数に格納
smolagentsの特徴 : CodeAct 23 step4 step2で取得したresultを DataFrameとして利用 Pandasの機能を使って可視化するた めに、データをPython上で加工 Pythonの表現力を使って振る舞うこ
とができる 具体例 : 先の分析の例
LLM領域の技術選定 24
分析エージェントの構成 (再掲) 25
分析エージェントの構成 (再掲) 26 なぜツール定義にMCPを採用? なぜワークフローが組めないフレームワークを採用?
分析エージェントの構成 (再掲) 27 なぜツール定義にMCPを採用? なぜワークフローが組めないフレームワークを採用? LLM関連領域の技術発展が日進月歩なため
LLMとその周辺の技術状況 28 • 最高性能のモデルはすぐに更新される • エージェント/ワークフローツールは 乱立している • LLMにデータ、ツール、文脈を与える 手法も日夜開発されている
出典: https://www.insightpartners.com/ideas/ai-agents-disrupting-automation/
ベストプラクティスの覆りやすさ 29 エージェント部 : 高 基盤モデルの性能向上や、新手法、新プロダクトによって覆される (マルチエージェントの自社開発そのものがほぼ不要になるかも)
ベストプラクティスの覆りやすさ 30 ツール部分: 中 現在は多くのエージェントがMCPに対応しているので、すぐに使 えなくなることはない しかしE2B(仮想環境ベースの文脈付与)など別の手法が主流になる可 能性はある
ベストプラクティスの覆りやすさ 31 ツールが参照する自社情報の整備 : 低 (例: データベースのスキーマ、APIの仕様) MCPで繋いだとしても、メタ情報や活用すべきドメイン知識が、 アクセス可能な形で言語化されていないと、エージェントの性能 が高くても最大限の性能を出せない
技術の発展を考慮したチームリソースの投下 32 自社が投資しなくても進歩していく 自社が投資しないと進歩しない エージェント最適化 選択肢が移り変わりやすい 選択肢が変化しづらい MCP対応 LLMリーダブルに情報を整備 すぐ乗り換えられる
ように、軽量に実装 新しいMCPクライア ントをすぐに試すこ とができるので、 できるだけ対応 一定コストを払って整備 例: APIドキュメントを充実化 データベースを一般的な規格にし て、固有表現をなるべく排除。メ タデータを可能な限り付与
まとめ 33 • smolagentsで分析用のエージェントを開発 ◦ CodeActは複数ツール連携や、データ加工にPythonの表現 力を使えることが利点 • LLM領域の移り変わりが激しいことを考慮して技術選定を実施 ◦
『エージェント < MCPのツール < 元となるリソース 』の 優先順位で力を入れて整備すると報われやすいのでは?