Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TransformerからMCPまで(現代AIを理解するための羅針盤)
Search
MIKIO KUBO
October 22, 2025
Programming
7
6k
TransformerからMCPまで(現代AIを理解するための羅針盤)
MIKIO KUBO
October 22, 2025
Tweet
Share
More Decks by MIKIO KUBO
See All by MIKIO KUBO
ポストSaaS時代:コンポーザブル、エージェント 型、成果指向ソフトウェアへの移行を読み解く
mickey_kubo
1
51
AIの二元論 -ビジネスリーダーのための水平型AIと垂直型AIに関する戦略的ガイド-
mickey_kubo
1
50
AIの二元論(詳細版)
mickey_kubo
0
18
Agentic AI フレームワーク戦略白書 (2025年度版)
mickey_kubo
1
78
Agentic AIを用いたサプライチェーン最適化
mickey_kubo
1
130
Google Opal解体新書
mickey_kubo
3
120
Google Opalで使える生成AIの能力と役割
mickey_kubo
0
88
Google Opalで使える37のライブラリ
mickey_kubo
3
200
Opal 例題解説
mickey_kubo
1
86
Other Decks in Programming
See All in Programming
Kotlinで実装するCPU/GPU 「協調的」パフォーマンス管理
matuyuhi
0
300
Temporal Knowledge Graphで作る! 時間変化するナレッジを扱うAI Agentの世界
po3rin
5
1.3k
React Nativeならぬ"Vue Native"が実現するかも?_新世代マルチプラットフォーム開発フレームワークのLynxとLynxのVue.js対応を追ってみよう_Vue Lynx
yut0naga1_fa
2
2k
Pythonに漸進的に型をつける
nealle
1
160
AI 時代だからこそ抑えたい「価値のある」PHP ユニットテストを書く技術 #phpconfuk / phpcon-fukuoka-2025
shogogg
1
280
テーブル定義書の構造化抽出して、生成AIでDWH分析を試してみた / devio2025tokyo
kasacchiful
0
400
MCPサーバー「モディフィウス」で変更容易性の向上をスケールする / modifius
minodriven
6
1.2k
pnpm に provenance のダウングレード を検出する PR を出してみた
ryo_manba
1
210
Swift Concurrency 年表クイズ
omochi
3
220
業務でAIを使いたい話
hnw
0
240
Designing Repeatable Edits: The Architecture of . in Vim
satorunooshie
0
250
GitHub Copilotを使いこなせ!/mastering_github_copilot!
kotakageyama
2
830
Featured
See All Featured
BBQ
matthewcrist
89
9.9k
Building Adaptive Systems
keathley
44
2.8k
KATA
mclloyd
PRO
32
15k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
2.9k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.7k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Building a Scalable Design System with Sketch
lauravandoore
463
33k
Building an army of robots
kneath
306
46k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.2k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Transcript
現代AI を理解するための羅針盤 Transformer からMCP までの全貌解説 1
はじめに:現代AI を理解する旅 目的: 複雑なAI専門用語を解き明かし、6つの核心概念を一つの物語として理解 する。 旅のルート: i. Transformer: すべての始まり ii.
LLM: 巨大なデジタル知性 iii. 生成AI: 無限の創造性 iv. RAG: 現実への接地 v. エージェントAI: 自律的な行動 vi. MCP: 協調する生態系 2
AI が遂げる「三重の進化」 進化の潮流: i. 計算 (Computation) → 認知 (Cognition) ii.
生成 (Generation) → 行動 (Action) iii. 孤立 (Siloed Systems) → 協調 (Collaborative Ecosystem) インターネットとの類似性: AIも階層的な技術スタックを形成している。 3
第1 章: Transformer すべての土台となる革命的技術 2017年に発表された、現代AIの礎石。 Transformer以前と以後で、自然言語処理 (NLP)の世界は一変した。 4
Transformer 以前の課題:逐次処理の壁 主役: RNN (再帰型ニューラルネットワーク) 課題: i. 長期依存性の問題: 文が長くなるほど、文頭の情報を「忘れてしまう」。 (例:長い話の前提を忘れてしまう状態)
ii. 並列化の困難性: 一語ずつ処理するため、GPUの並列処理能力を活かせない。 モデルの訓練に膨大な時間がかかっていた。 5
中核的革新:アテンション機構 発想: 文中の単語を「同時」に処理し、単語間の関連性を計算する。 仕組み: 重要な単語に「注意 (Attention)」を向け、文脈を正確に捉える。 比喩: ウェブ検索 (Query, Key,
Value) Query (Q): 検索したい単語 (あなた) Key (K): 関連性を示す見出し (ウェブページのタイトル) Value (V): 意味そのもの (ウェブページの本文) 6
Transformer のその他の工夫 マルチヘッド・アテンション: 複数の「アテンション」で、文脈を多角的に捉える。 比喩: 専門家ぞろいの探偵チーム (指紋、アリバイ、動機など) 位置エンコーディング: 同時処理で失われた「語順」情報を補う。 比喩:
各単語に「座席番号」を付与する。 7
革命的インパクト:スケールの解放 最大の功績: 逐次処理の制約からAIを解放し、 完全な並列処理を可能にした。 結果: GPUの性能を最大限に引き出すことに成功。 モデルの巨大化と性能向上の好循環( スケーリング則)が生まれる。 → 大規模言語モデル
(LLM) の誕生へ 8
第2 章: 大規模言語モデル (LLM) 言葉を操る巨大な知性 Transformerというエンジンを使い、「規模(スケール)」を追求した結果。 ChatGPT, Gemini 9
LLM とは何か? 核心タスク: 「与えられた単語の次に、最も自然に来る単語を予測する」 (例:「吾輩は猫である。名前はまだ__」 → 「無い」 ) この単純なタスクを極めることで、文法、事実、論理的推論能力などを獲得す る。
「大規模」の正体: i. パラメータ: モデルの脳内にある無数の「調整ダイヤル」。(GPT-3で1750 億個) ii. データ: インターネット上の膨大なテキスト。 10
スケールの魔法:創発的能力 モデルの規模がある閾値を超えると、教えられていない新しい能力が「 創発 (emerge)」する。 創発的能力の例: 要約 質疑応答 コード生成 数学的推論 これは「量質転化」の一例。
11
LLM は「文化の鏡」である 訓練データ: インターネットという人類の知識と表現の集合体。 意味: LLMは我々のデジタル文化を写し出す「鏡」。 光: 科学的知識、文学的創造性 影: 社会的偏見、誤情報、論理的誤謬(
ハルシネーション) 課題: この強力な鏡に何を映し、どう活用していくか? 12
第3 章: 生成AI 無から有を生み出す魔法 AIが分析ツールから、人間の創造性を拡張するパートナーへと変貌。 テキスト、画像、音楽、コードなど、あらゆるデジタルコンテンツを生成す る。 13
生成AI の位置づけ 生成AI とは: 学習したデータパターンに基づき、新しいオリジナルコンテンツ を生成するAIの総称。 LLM との関係: すべてのLLM は生成AI
の一種 しかし、すべての生成AI がLLM ではない LLMは、生成AIの中で「テキスト生成」に特化したサブカテゴリー。 14
テキストを超えた創造性の爆発 画像: DALL-E, Midjourney (プロンプトから画像を生成) 動画: Sora, Veo (テキストから動画を生成) 音声・音楽:
特定の作曲家スタイルで新曲を作成 コード: 自然言語の指示からプログラムを生成 3D モデル: 建築プランやゲームキャラクターを自動生成 合成データ: プライバシーが重要な領域で訓練用データを生成 15
生成AI = 「万能コンテンツエンジン」 本質: あるドメインに十分なデータがあれば、そのルールに従った新しい成果 物を自動生成できる。 インパクト: デジタルコンテンツの「第一稿」作成コストがゼロに近づく。 人間の役割は、より高度な知的作業へシフト。 創造
(Creation) → キュレーション (Curation), 戦略 (Strategy) 16
第4 章: RAG ( 検索拡張生成) AI を” 知ったかぶり” から” 専門家”
へ LLMの実用化における2つの致命的な弱点を克服する技術。 i. 知識の陳腐化 (Knowledge Cutoff) ii. ハルシネーション (Hallucination) 17
RAG による解決策:現実への接地 核心アイデア: LLMが回答を生成する前に、 外部の信頼できる知識ソースにア クセスさせる。 目的: LLMの回答を、リアルタイムかつ正確な情報に「 接地 (grounding)」さ
せる。 比喩: オープンブック・テスト ( 開本試験) 通常のLLM: 記憶だけが頼りの「閉本試験」 RAG: 教科書や資料を参照できる「開本試験」 18
RAG の3 ステップ・プロセス 1. 検索 (Retrieve) ユーザーの質問に基づき、外部の知識ベース(社内文書、DBなど)から関 連情報を探し出す。 2. 拡張
(Augment) 取得した情報を、元の質問文に付け加え「拡張プロンプト」を作成する。 3. 生成 (Generate) 拡張プロンプトをLLMに渡し、提供された事実にのみ基づいて回答を生成 させる。 19
RAG の価値:2 つの世界の架け橋 RAGは、2つの異なる世界を繋ぐアーキテクチャ上の「架け橋」。 確率論的な世界: LLM(創造的だが、時に不正確) 決定論的な世界: データベース(事実に基づき、常に正確) 決定論的な検索システムが、確率論的な生成システムに「 ガードレール」を提
供する。 これにより、企業は 信頼できるAIを実現できる。 20
第5 章: エージェントAI 自ら考え、行動するAI AIが受動的なツールから、 能動的な主体へと進化。 高レベルの目標を与えると、自ら計画を立て、ツールを使い、タスクを遂行す る自律的なシステム。 21
エージェントの思考・行動サイクル 4つのステップを自律的に繰り返すことで、複雑なタスクを遂行する。 1. 知覚 (Perception): 環境から情報を収集する(メール、DB、Webなど)。 2. 推論と計画 (Reasoning &
Planning): 目標をサブタスクに分解し、実行計画を 立てる。 3. 行動 (Action): 外部のツールやAPIを呼び出し、計画を実行する。 4. 省察 (Reflection): 結果を評価し、必要であれば計画を修正する。 22
エージェントAI = 知性の司令塔 これまで議論してきたAI概念を統合し、指揮する「 オーケストレーター」。 脳: LLM 情報収集: RAG タスク実行:
生成AIや外部ツール 比喩: プロジェクトマネージャー プロジェクト目標を理解し、計画を立て、専門家(他のAI)にタスクを割 り振り、進捗を管理して成功に導く。 23
知性の「アプリケーション層」 エージェントAIは、AIの知性を具体的な「仕事」に変換するアプリケーション 層。 パラダイムシフト: 旧: 人間が個別のタスクを指示 (直接操作) (例:「請求書を作成」ボタンを押す) 新: 人間が目的を委任
(意図の委任) (例:「月末の請求処理を完了させておいて」と指示する) 人間は、知的作業の「 監督者」「 戦略家」へと役割が変わる。 24
第6 章: MCP (Model Context Protocol) AI エージェントを繋ぐ共通言語 新たなボトルネック: 連携したいツールごとにAPI仕様が異なり、接続が煩雑に
なる「 ツールのバベルの塔」問題。 これを解決し、真のAIエコシステムを構築するための標準規格。 25
解決策:MCP = AI のためのUSB-C 役割: AIエージェントと外部ツールとの通信方法を標準化するオープンなプロ トコル。 比喩: AI のためのUSB-C
ポート かつてデバイスごとに異なっていた充電ケーブルがUSB-Cで統一されたよ うに、MCPはAIとツールの接続を標準化する。 MCPに準拠していれば、どんなツールでもどんなエージェントにも「 プラ グアンドプレイ」で接続可能になる。 26
MCP が拓く未来:「エージェント経済圏」 影響: MCPは、将来の「 エージェント経済圏 (Agent Economy)」の誕生を可能 にする。 HTTPがWebサイト市場を、App Storeがモバイルアプリ市場を創出したよう
に、MCPはAIエージェントとツールの市場を創出する。 未来像: 特定タスクに特化した「専門家エージェント」が登場。 「元請けエージェント」が、市場から最適な専門家エージェントに業務を 委託し、協業して複雑な問題を解決する。 27
結論:壮大なる統合とAI の未来 6つの概念は独立せず、一つの統合されたワークフローとして連携する。 1. 人間が高レベルの目標を エージェントAIに与える。 2. エージェントはLLMを脳として計画を立案。 3. RAGで最新・正確な情報を収集。
4. MCPを通じて外部の専門ツール( 生成AIなど)を呼び出す。 5. Transformerベースの各AIが連携し、目標を達成する。 28
ご清聴ありがとうございました 29