白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か？ / Is it true that “the more you divide AI agents, the better”?

白金鉱業 Meetup Vol.24@六本木（若手データサイエンティスト交流編） 2026年6月18日株式会社ブレインパッド中西映人「AIエージェントは分けるほど良い」は本当か？

©BrainPad Inc. Strictly Confidential 2 自己紹介中西映人 Akito Nakanishi
株式会社ブレインパッドデータサイエンティスト 2025年新卒入社研究 1. SNSを通した高齢運転者に対する意見の定量化 (NLP) • Twitter/YouTube/自然言語処理/トピック分析/感情分析 2. 日本語のステレオタイプ誘発プロンプトに対するLLMの安全性の分析 • LLM/毒性分析/感情分析経験した案件 1. メーカー： CRM強化に向けた集計可視化/アンケートテキスト分析 2. 情報サービス：LLMによるスコアリングシステムの開発 Reference • X/Twitter (@kanure24) • LinkedIn (akito-nakanishi) • AI活用の最新技術トレンド：言語処理学会2026参加レポート

3 ©BrainPad Inc. Strictly Confidential 「AIエージェントは分けるほど良い」は本当でしょうか？今日のお話

4 ©BrainPad Inc. Strictly Confidential 研究紹介の前に... (1/2) マルチエージェントシステム (MAS) とは、複数のLLMが役割を分担して協調するシステムを指す
シングルエージェント (SA) マルチエージェントシステム (MAS) [1] https://arxiv.org/abs/2502.14321 1つのLLM*が全て処理する複数のLLMで役割を分担するあなたの役割は、スライドレビューですあなたの役割は、技術調査ですあなたの役割は、コード実装ですあなたの役割は、タスク設計です Figure 3:Five canonical communication architectures for LLM-MAS ([1]より引用) *Large Language Model: 大規模言語モデル

5 ©BrainPad Inc. Strictly Confidential MAS’s Collaboration Types [2] 研究紹介の前に...
(2/2) MASには協調型・議論型の2タイプがあり、各タイプから1つ研究を紹介する共通ゴールに向けて役割分担しながら協力例：コード生成 / 意思決定 / 推薦システム Cooperation 協調型 [2] https://arxiv.org/abs/2501.06322 ※論文では両者を融合させた第3のタイプ（Coopetition）も定義されていますが、本発表では簡略化のため割愛します。 Competition 競争・議論型各エージェントが独自の立場で対立・議論し洗練例：ディベート / 戦略的ゲーム研究① MASによる知識階層の誤り修正研究② MASによる議論の多様性の検証 NLP2026より、関連する2つの研究を紹介します

6 ©BrainPad Inc. Strictly Confidential 研究①: MASによる知識階層の誤り修正交通用語ペアの正誤判定タスクにおいて、「まとめ役」を加えたMAS構成で最も推論精度が高い引用：LLM エージェント間の議論を通じた知識階層の修正
(NLP2026 画像は引用元を参考に発表者が作成) • LLMが生成した知識階層には、is-a関係の誤りを含む • 緊急車両は車両である、規制標識は標識である • 駐車禁止は標識である • 複数エージェントの意見集約には、構造上の改善余地がある多様な議論形態を対象に、性能差を明らかにする 1. データ：交通用語ペア • is-a関係の正誤アノテーション済み 2. 比較対象：リレー/パラレル形式 × まとめ役あり/なし 3. モデル：gpt-4o・gpt-4o-mini 「リレー形式＋まとめ役あり」で最も性能が高い (F1 score:0.836) ... リレー形式：意見が多様化しやすい (後述) ... まとめ役：情報の要約により、コンテキスト効率が高い • 複数のエージェントに分けることで、正誤判定タスクの精度向上につながるケースがある • エージェントの構成・役割設計により、タスクに合わせた調整余地がある背景・目的データ・手法結果・考察結論

7 ©BrainPad Inc. Strictly Confidential 研究②: MASによる議論の多様性の検証同じ視点条件 (Ex. 倫理的)
を与えた場合、MASよりSAの方が多様性が高い単一エージェントとマルチエージェントの生成多様性の評価 (NLP2026) 背景・目的データ・手法結果・考察結論 • 先行研究では、MASのみでプロンプト条件づけ (PC) を行った上で、SAとMASの多様性を比較している • SA：「回答して」 • MAS：「倫理的に回答して」「政治的に回答して」 • 観測結果が、構造とPCのどちらが原因か切り分けできない PCを統制した上で、意味的多様性を定量比較する 1. 質問文：GPT5で、複数回答を許容する設問を300個生成 • 例：瞬間移動が可能になったら？ 2. 比較対象：SA・並列型MAS・逐次型MAS 3. 多様性指標：Vendi Score 4. モデル：Gemini-2.5 Flash-Lite, Qwen3-32B, GPT-4.1 mini • 複数のエージェントに分けること自体が多様性を生むわけではない • 出力される情報の受け渡し設計が、多様性の鍵となる全てのモデル・条件で、SA > S-MAS > P-MAS ... P-MAS：独立した生成により、出力が同質化しやすい ... S-MAS：別系列へのプロンプトの再注入が多様性を損なう

8 ©BrainPad Inc. Strictly Confidential 例①：購買確率シミュレーション例②：購買理由の推論研究①：出力結果を制御したいエージェントを分け、役割を明確化する研究②：結果に多様性を求める
エージェントを分けない方が均質化しにくい実務への示唆 AIエージェントの構成は、求める結果 (制御 vs多様性) に応じて設計する (プロンプト) あなたが該当商品を購入した理由を、以下の観点から教えてください。 - 普段の行動特性 - 価値観・関心領域 - ... ### 商品データ {product_data} Cooperation 協調型 Competition 競争・議論型「求める結果」に応じた分け方を考える特徴量抽出エージェント数値・テキスト → テキスト文字抽出エージェント画像→ テキストスコア算出エージェントテキスト → 数値

9 ©BrainPad Inc. Strictly Confidential DS2年目の気づき研究をビジネスで活かすには、「ビジネス上の意味」を問う視点が不可欠であるアカデミックビジネス研究とビジネスの両視点を活かし、社会・クライアントに貢献するDSを目指す
最新研究のキャッチアップ（論文・学会）研究への活用最新研究のキャッチアップ（論文・学会）クライアントの本質的な課題解決に接続できるか？実務への活用比較的活用しやすい (巨人の肩に乗る) 要件・制約をもとに応用する

株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号六本木ティーキューブ TEL：03-6721-7002 FAX：03-6721-7010 www.brainpad.co.jp [email protected] 本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。
©BrainPad Inc.

白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か？ / Is ...

白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か？ / Is it true that “the more you divide AI agents, the better”?

BrainPad

More Decks by BrainPad

Other Decks in Technology

Featured

Transcript

白金鉱業 Meetup Vol.24@六本木（若手データサイエンティスト交流編） 2026年6月18日株式会社ブレインパッド中西映人「AIエージェントは分けるほど良い」は本当か？

©BrainPad Inc. Strictly Confidential 2 自己紹介中西映人 Akito Nakanishi

3 ©BrainPad Inc. Strictly Confidential 「AIエージェントは分けるほど良い」は本当でしょうか？今日のお話

4 ©BrainPad Inc. Strictly Confidential 研究紹介の前に... (1/2) マルチエージェントシステム (MAS) とは、複数のLLMが役割を分担して協調するシステムを指す

5 ©BrainPad Inc. Strictly Confidential MAS’s Collaboration Types [2] 研究紹介の前に...

6 ©BrainPad Inc. Strictly Confidential 研究①: MASによる知識階層の誤り修正交通用語ペアの正誤判定タスクにおいて、「まとめ役」を加えたMAS構成で最も推論精度が高い引用：LLM エージェント間の議論を通じた知識階層の修正

7 ©BrainPad Inc. Strictly Confidential 研究②: MASによる議論の多様性の検証同じ視点条件 (Ex. 倫理的)

8 ©BrainPad Inc. Strictly Confidential 例①：購買確率シミュレーション例②：購買理由の推論研究①：出力結果を制御したいエージェントを分け、役割を明確化する研究②：結果に多様性を求める