TinyTroupeで人狼ゲームやってみた！

1 / 7 TinyTroupeで人狼ゲームをやってみた AIマルチエージェントの理想と現実上田茂雄 / @ueponx

ueponx 上田茂雄 / Ueda Shigeo @ueponx 上田茂雄 uepon日々の備忘録所属
中京テレビ放送 ICT推進部名城大学非常勤講師愛知大学非常勤講師京都精華大学非常勤講師名古屋工業大学修士（社会工学）2026年3月修了コミュニティ • IBM Champion 8年連続受賞（2026含む） • Nagoazu運営 Azure User Group Nagoya • SeeedJP UG運営 IoT / Maker Community Skills & Interests IBM Champion Node-RED IoT / Raspberry Pi AI / LLM RAG / GraphRAG ナレッジグラフ RDF / Neo4j MCP / AI Agent 放送システム watsonx Azure ローカルLLM

2 / 7 TinyTroupeとは Microsoft製マルチエージェントシミュレーションライブラリ LLMでペルソナを持つエージェント（TinyPerson）を作成し、仮想環境（TinyWorld）内でエージェント同士を対話させるPythonライブラリ GitHub ★
7,000+ MITライセンス v0.6.0（2025年）対応 LLM OpenAI / Azure（推奨） Ollama（実験的）想定用途顧客インタビューフォーカスグループ広告評価 ✦ 本来は「善意の対話者」同士の自由な対話をシミュレーションするツール

3 / 7 AI × 人狼ゲームの背景人狼知能プロジェクト（AIWolf） • 2013年から続くAI研究のグランドチャレンジ
• 不完全情報 × コミュニケーションゲーム • 将棋・囲碁とは異なるAI課題 • 「推定＋思考」と「コミュニケーション」の両方が必要実験について TinyTroupeの仕組み各エージェントは別々のAPIコールで動作 → 内部状態は分離されているただし非対称性をゲームとして機能させるにはプロンプトや設定の十分な設計が必要要素完全情報ゲーム（将棋等）人狼ゲーム情報構造全情報公開非対称（役職を秘匿）コミュニケーション不要（手を指すのみ）自然言語での議論が必須求められる能力探索・評価推理・欺瞞・説得

4 / 7 ローカルLLMへの切り替えデフォルト構成 OpenAI API Azure OpenAI （クラウド型LLM）
壁にぶつかる従量課金コストレート制限（TPM） 429エラー頻発ローカルに変更 Ollama + gpt-oss:20b WSL2 + RTX 4090 → → 技術的なポイント • TinyTroupe v0.6.0のOllamaクライアントにバグ → OpenAI互換モード（/v1）で回避 • WSL2からWindows側Ollamaへの接続: ip route でホストIP取得 + OLLAMA_HOST=0.0.0.0 • 環境切り替えスクリプト: source ollama_activate_env.sh でconfig.ini自動生成 • RTX 4090版: WSL2上にOllamaをインストール、ローカルGPUで直接推論（レート制限なし）

5 / 7 盛大に失敗した結果ゲーム文脈が崩壊「人狼」を哲学的な「人間とは何か」と解釈。風や雨について詩的に語り始める。投票が完全に破綻宮崎駿・宮本武蔵・山田太郎に投票。ゲーム参加者の名前を挙げられない。
同調・オウム返しの連鎖全員「観察しましょう」で合意し続ける。対立・疑惑・反論が一切発生しない。役職行動の欠如人狼が嘘をつかない。占い師が占わない。 3人の発言を入れ替えても違和感なし。 3回の試行すべてで人狼ゲームとして成立する議論は実現できなかった

6 / 7 構造的な課題情報の非対称性を活かす設計の不足各エージェントは別々のAPIコールで動作し、内部状態は分離されている。しかし、その非対称性をゲームとして機能させるには、プロンプトや設定の十分な設計が必要。デフォルトの仕組みだけでは不十分だった。ハルシネーション＋同調他エージェントの発言に引きずられ全員が同じ方向に流れる。
対立構造が生まれない。トークン消費が膨大 1エージェント1回: 5,000〜7,000トークン 3人最小構成の1日分: 約54,000トークン 5人3日間: 約462,000トークンレート制限の壁 → ローカルGPU必須の領域バックエンドレート制限評価 Ollama Cloud（Free）日次上限あり / 429頻発マルチエージェントには不向き OpenAI API（Tier 1） 200K TPM 3人が限界、5人は困難ローカルGPU（RTX 4090）制限なし TinyTroupeに最適

7 / 7 まとめ・学び 01 人狼ゲームには十分な設計が必要各エージェントの内部状態は分離されているが、非対称性を活かすにはプロンプトの作り込み
が不可欠。 02 マルチエージェント = トークン爆発エージェント数 × ターン数 × トークン数でコストが乗算的に増加。ローカルGPUが必須。 03 TinyTroupeの得意・不得意協調的な自由対話には最適。対立・欺瞞・ルール進行のゲームには設計が合わない。今後について • 独立エージェント間の対戦構造で真の駆け引きを実現 • ハイブリッドアプローチの検討 … ルールベース（戦略判断）＋ LLM（自然言語生成）の組み合わせ

TinyTroupeで人狼ゲームやってみた！

TinyTroupeで人狼ゲームやってみた！

ueponx

More Decks by ueponx

Other Decks in Technology

Featured

Transcript

1 / 7 TinyTroupeで人狼ゲームをやってみた AIマルチエージェントの理想と現実上田茂雄 / @ueponx

ueponx 上田茂雄 / Ueda Shigeo @ueponx 上田茂雄 uepon日々の備忘録所属

2 / 7 TinyTroupeとは Microsoft製マルチエージェントシミュレーションライブラリ LLMでペルソナを持つエージェント（TinyPerson）を作成し、仮想環境（TinyWorld）内でエージェント同士を対話させるPythonライブラリ GitHub ★

3 / 7 AI × 人狼ゲームの背景人狼知能プロジェクト（AIWolf） • 2013年から続くAI研究のグランドチャレンジ

4 / 7 ローカルLLMへの切り替えデフォルト構成 OpenAI API Azure OpenAI （クラウド型LLM）

5 / 7 盛大に失敗した結果ゲーム文脈が崩壊「人狼」を哲学的な「人間とは何か」と解釈。風や雨について詩的に語り始める。投票が完全に破綻宮崎駿・宮本武蔵・山田太郎に投票。ゲーム参加者の名前を挙げられない。

7 / 7 まとめ・学び 01 人狼ゲームには十分な設計が必要各エージェントの内部状態は分離されているが、非対称性を活かすにはプロンプトの作り込み