Upgrade to Pro — share decks privately, control downloads, hide ads and more …

白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is ...

白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?

2026年6月18日に実施した、白金鉱業 Meetup Vol.24@六本木(若手データサイエンティスト交流編)
での株式会社 ブレインパッド中西の登壇スライドです。

イベントURL
https://brainpad-meetup.connpass.com/event/392729/

Avatar for BrainPad

BrainPad

June 18, 2026

More Decks by BrainPad

Other Decks in Technology

Transcript

  1. ©BrainPad Inc. Strictly Confidential 2 自己紹介 中西 映人 Akito Nakanishi

    株式会社ブレインパッド データサイエンティスト 2025年新卒入社 研究 1. SNSを通した高齢運転者に対する意見の定量化 (NLP) • Twitter/YouTube/自然言語処理/トピック分析/感情分析 2. 日本語のステレオタイプ誘発プロンプトに対するLLMの安全性の分析 • LLM/毒性分析/感情分析 経験した案件 1. メーカー: CRM強化に向けた集計可視化/アンケートテキスト分析 2. 情報サービス:LLMによるスコアリングシステムの開発 Reference • X/Twitter (@kanure24) • LinkedIn (akito-nakanishi) • AI活用の最新技術トレンド:言語処理学会2026参加レポート
  2. 4 ©BrainPad Inc. Strictly Confidential 研究紹介の前に... (1/2) マルチエージェントシステム (MAS) とは、複数のLLMが役割を分担して協調するシステムを指す

    シングルエージェント (SA) マルチエージェントシステム (MAS) [1] https://arxiv.org/abs/2502.14321 1つのLLM*が全て処理する 複数のLLMで役割を分担する あなたの役割は、スライドレビューです あなたの役割は、技術調査です あなたの役割は、コード実装です あなたの役割は、タスク設計です Figure 3:Five canonical communication architectures for LLM-MAS ([1]より引用) *Large Language Model: 大規模言語モデル
  3. 5 ©BrainPad Inc. Strictly Confidential MAS’s Collaboration Types [2] 研究紹介の前に...

    (2/2) MASには協調型・議論型の2タイプがあり、各タイプから1つ研究を紹介する 共通ゴールに向けて役割分担しながら協力 例:コード生成 / 意思決定 / 推薦システム Cooperation 協調型 [2] https://arxiv.org/abs/2501.06322 ※論文では両者を融合させた第3のタイプ(Coopetition)も 定義されていますが、本発表では簡略化のため割愛します。 Competition 競争・議論型 各エージェントが独自の立場で対立・議論し洗練 例:ディベート / 戦略的ゲーム 研究① MASによる知識階層の誤り修正 研究② MASによる議論の多様性の検証 NLP2026より、関連する2つの研究を紹介します
  4. 6 ©BrainPad Inc. Strictly Confidential 研究①: MASによる知識階層の誤り修正 交通用語ペアの正誤判定タスクにおいて、「まとめ役」を加えたMAS構成で最も推論精度が高い 引用:LLM エージェント間の議論を通じた知識階層の修正

    (NLP2026 画像は引用元を参考に発表者が作成) • LLMが生成した知識階層には、is-a関係の誤りを含む • 緊急車両は車両である、規制標識は標識である • 駐車禁止は標識である • 複数エージェントの意見集約には、構造上の改善余地がある 多様な議論形態を対象に、性能差を明らかにする 1. データ:交通用語ペア • is-a関係の正誤アノテーション済み 2. 比較対象:リレー/パラレル形式 × まとめ役あり/なし 3. モデル:gpt-4o・gpt-4o-mini 「リレー形式+まとめ役あり」で最も性能が高い (F1 score:0.836) ... リレー形式:意見が多様化しやすい (後述) ... まとめ役 :情報の要約により、コンテキスト効率が高い • 複数のエージェントに分けることで、正誤判定タスクの精度向上につながるケースがある • エージェントの構成・役割設計により、タスクに合わせた調整余地がある 背景・目的 データ・手法 結果・考察 結論
  5. 7 ©BrainPad Inc. Strictly Confidential 研究②: MASによる議論の多様性の検証 同じ視点条件 (Ex. 倫理的)

    を与えた場合、MASよりSAの方が多様性が高い 単一エージェントとマルチエージェントの生成多様性の評価 (NLP2026) 背景・目的 データ・手法 結果・考察 結論 • 先行研究では、MASのみでプロンプト条件づけ (PC) を行った上で、SAとMASの多様性を比較している • SA:「回答して」 • MAS:「倫理的に回答して」「政治的に回答して」 • 観測結果が、構造とPCのどちらが原因か切り分けできない PCを統制した上で、意味的多様性を定量比較する 1. 質問文:GPT5で、複数回答を許容する設問を300個生成 • 例:瞬間移動が可能になったら? 2. 比較対象:SA・並列型MAS・逐次型MAS 3. 多様性指標:Vendi Score 4. モデル:Gemini-2.5 Flash-Lite, Qwen3-32B, GPT-4.1 mini • 複数のエージェントに分けること自体が多様性を生むわけではない • 出力される情報の受け渡し設計が、多様性の鍵となる 全てのモデル・条件で、SA > S-MAS > P-MAS ... P-MAS:独立した生成により、出力が同質化しやすい ... S-MAS:別系列へのプロンプトの再注入が多様性を損なう
  6. 8 ©BrainPad Inc. Strictly Confidential 例①:購買確率シミュレーション 例②:購買理由の推論 研究①:出力結果を制御したい エージェントを分け、役割を明確化する 研究②:結果に多様性を求める

    エージェントを分けない方が均質化しにくい 実務への示唆 AIエージェントの構成は、求める結果 (制御 vs多様性) に応じて設計する (プロンプト) あなたが該当商品を購入した理由を、以下の観点から教えてください。 - 普段の行動特性 - 価値観・関心領域 - ... ### 商品データ {product_data} Cooperation 協調型 Competition 競争・議論型 「求める結果」に応じた分け方を考える 特徴量抽出 エージェント 数値・テキスト → テキスト 文字抽出 エージェント 画像→ テキスト スコア算出 エージェント テキスト → 数値
  7. 9 ©BrainPad Inc. Strictly Confidential DS2年目の気づき 研究をビジネスで活かすには、「ビジネス上の意味」を問う視点が不可欠である アカデミック ビジネス 研究とビジネスの両視点を活かし、社会・クライアントに貢献するDSを目指す

    最新研究のキャッチアップ (論文・学会) 研究への活用 最新研究のキャッチアップ (論文・学会) クライアントの本質的な課題解決に 接続できるか? 実務への活用 比較的活用しやすい (巨人の肩に乗る) 要件・制約をもとに 応用する