Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TransformerからMCPまで(現代AIを理解するための羅針盤)
Search
MIKIO KUBO
October 22, 2025
Programming
1
45
TransformerからMCPまで(現代AIを理解するための羅針盤)
MIKIO KUBO
October 22, 2025
Tweet
Share
More Decks by MIKIO KUBO
See All by MIKIO KUBO
Agentic AI フレームワーク戦略白書 (2025年度版)
mickey_kubo
1
20
Agentic AIを用いたサプライチェーン最適化
mickey_kubo
1
63
Google Opal解体新書
mickey_kubo
3
64
Google Opalで使える生成AIの能力と役割
mickey_kubo
0
46
Google Opalで使える37のライブラリ
mickey_kubo
2
120
Opal 例題解説
mickey_kubo
0
62
エージェントAI フレームワーク 2025 年版
mickey_kubo
0
34
AIを使って最新研究 について調べて発表しよ う!
mickey_kubo
4
64
モダンWeb認証入門
mickey_kubo
1
33
Other Decks in Programming
See All in Programming
エンジニアインターン「Treasure」とHonoの2年、そして未来へ / Our Journey with Hono Two Years at Treasure and Beyond
carta_engineering
0
360
AIと人間の共創開発!OSSで試行錯誤した開発スタイル
mae616
2
750
他言語経験者が Golangci-lint を最初のコーディングメンターにした話 / How Golangci-lint Became My First Coding Mentor: A Story from a Polyglot Programmer
uma31
0
310
あなたとKaigi on Rails / Kaigi on Rails + You
shimoju
0
170
What Spring Developers Should Know About Jakarta EE
ivargrimstad
0
330
実践Claude Code:20の失敗から学ぶAIペアプログラミング
takedatakashi
15
6.2k
Things You Thought You Didn’t Need To Care About That Have a Big Impact On Your Job
hollycummins
0
240
iOSでSVG画像を扱う
kishikawakatsumi
0
140
Writing Better Go: Lessons from 10 Code Reviews
konradreiche
0
3.3k
スキーマ駆動で、Zod OpenAPI Honoによる、API開発するために、Hono Takibiというライブラリを作っている
nakita628
0
250
CSC305 Lecture 08
javiergs
PRO
0
250
Pull-Requestの内容を1クリックで動作確認可能にするワークフロー
natmark
2
520
Featured
See All Featured
Designing for humans not robots
tammielis
254
26k
Testing 201, or: Great Expectations
jmmastey
45
7.7k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.6k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
990
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
10
880
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
Optimizing for Happiness
mojombo
379
70k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
The Power of CSS Pseudo Elements
geoffreycrofte
79
6k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.1k
The Straight Up "How To Draw Better" Workshop
denniskardys
238
140k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Transcript
現代AI を理解するための羅針盤 Transformer からMCP までの全貌解説 1
はじめに:現代AI を理解する旅 目的: 複雑なAI専門用語を解き明かし、6つの核心概念を一つの物語として理解 する。 旅のルート: i. Transformer: すべての始まり ii.
LLM: 巨大なデジタル知性 iii. 生成AI: 無限の創造性 iv. RAG: 現実への接地 v. エージェントAI: 自律的な行動 vi. MCP: 協調する生態系 2
AI が遂げる「三重の進化」 進化の潮流: i. 計算 (Computation) → 認知 (Cognition) ii.
生成 (Generation) → 行動 (Action) iii. 孤立 (Siloed Systems) → 協調 (Collaborative Ecosystem) インターネットとの類似性: AIも階層的な技術スタックを形成している。 3
第1 章: Transformer すべての土台となる革命的技術 2017年に発表された、現代AIの礎石。 Transformer以前と以後で、自然言語処理 (NLP)の世界は一変した。 4
Transformer 以前の課題:逐次処理の壁 主役: RNN (再帰型ニューラルネットワーク) 課題: i. 長期依存性の問題: 文が長くなるほど、文頭の情報を「忘れてしまう」。 (例:長い話の前提を忘れてしまう状態)
ii. 並列化の困難性: 一語ずつ処理するため、GPUの並列処理能力を活かせない。 モデルの訓練に膨大な時間がかかっていた。 5
中核的革新:アテンション機構 発想: 文中の単語を「同時」に処理し、単語間の関連性を計算する。 仕組み: 重要な単語に「注意 (Attention)」を向け、文脈を正確に捉える。 比喩: ウェブ検索 (Query, Key,
Value) Query (Q): 検索したい単語 (あなた) Key (K): 関連性を示す見出し (ウェブページのタイトル) Value (V): 意味そのもの (ウェブページの本文) 6
Transformer のその他の工夫 マルチヘッド・アテンション: 複数の「アテンション」で、文脈を多角的に捉える。 比喩: 専門家ぞろいの探偵チーム (指紋、アリバイ、動機など) 位置エンコーディング: 同時処理で失われた「語順」情報を補う。 比喩:
各単語に「座席番号」を付与する。 7
革命的インパクト:スケールの解放 最大の功績: 逐次処理の制約からAIを解放し、 完全な並列処理を可能にした。 結果: GPUの性能を最大限に引き出すことに成功。 モデルの巨大化と性能向上の好循環( スケーリング則)が生まれる。 → 大規模言語モデル
(LLM) の誕生へ 8
第2 章: 大規模言語モデル (LLM) 言葉を操る巨大な知性 Transformerというエンジンを使い、「規模(スケール)」を追求した結果。 ChatGPT, Gemini 9
LLM とは何か? 核心タスク: 「与えられた単語の次に、最も自然に来る単語を予測する」 (例:「吾輩は猫である。名前はまだ__」 → 「無い」 ) この単純なタスクを極めることで、文法、事実、論理的推論能力などを獲得す る。
「大規模」の正体: i. パラメータ: モデルの脳内にある無数の「調整ダイヤル」。(GPT-3で1750 億個) ii. データ: インターネット上の膨大なテキスト。 10
スケールの魔法:創発的能力 モデルの規模がある閾値を超えると、教えられていない新しい能力が「 創発 (emerge)」する。 創発的能力の例: 要約 質疑応答 コード生成 数学的推論 これは「量質転化」の一例。
11
LLM は「文化の鏡」である 訓練データ: インターネットという人類の知識と表現の集合体。 意味: LLMは我々のデジタル文化を写し出す「鏡」。 光: 科学的知識、文学的創造性 影: 社会的偏見、誤情報、論理的誤謬(
ハルシネーション) 課題: この強力な鏡に何を映し、どう活用していくか? 12
第3 章: 生成AI 無から有を生み出す魔法 AIが分析ツールから、人間の創造性を拡張するパートナーへと変貌。 テキスト、画像、音楽、コードなど、あらゆるデジタルコンテンツを生成す る。 13
生成AI の位置づけ 生成AI とは: 学習したデータパターンに基づき、新しいオリジナルコンテンツ を生成するAIの総称。 LLM との関係: すべてのLLM は生成AI
の一種 しかし、すべての生成AI がLLM ではない LLMは、生成AIの中で「テキスト生成」に特化したサブカテゴリー。 14
テキストを超えた創造性の爆発 画像: DALL-E, Midjourney (プロンプトから画像を生成) 動画: Sora, Veo (テキストから動画を生成) 音声・音楽:
特定の作曲家スタイルで新曲を作成 コード: 自然言語の指示からプログラムを生成 3D モデル: 建築プランやゲームキャラクターを自動生成 合成データ: プライバシーが重要な領域で訓練用データを生成 15
生成AI = 「万能コンテンツエンジン」 本質: あるドメインに十分なデータがあれば、そのルールに従った新しい成果 物を自動生成できる。 インパクト: デジタルコンテンツの「第一稿」作成コストがゼロに近づく。 人間の役割は、より高度な知的作業へシフト。 創造
(Creation) → キュレーション (Curation), 戦略 (Strategy) 16
第4 章: RAG ( 検索拡張生成) AI を” 知ったかぶり” から” 専門家”
へ LLMの実用化における2つの致命的な弱点を克服する技術。 i. 知識の陳腐化 (Knowledge Cutoff) ii. ハルシネーション (Hallucination) 17
RAG による解決策:現実への接地 核心アイデア: LLMが回答を生成する前に、 外部の信頼できる知識ソースにア クセスさせる。 目的: LLMの回答を、リアルタイムかつ正確な情報に「 接地 (grounding)」さ
せる。 比喩: オープンブック・テスト ( 開本試験) 通常のLLM: 記憶だけが頼りの「閉本試験」 RAG: 教科書や資料を参照できる「開本試験」 18
RAG の3 ステップ・プロセス 1. 検索 (Retrieve) ユーザーの質問に基づき、外部の知識ベース(社内文書、DBなど)から関 連情報を探し出す。 2. 拡張
(Augment) 取得した情報を、元の質問文に付け加え「拡張プロンプト」を作成する。 3. 生成 (Generate) 拡張プロンプトをLLMに渡し、提供された事実にのみ基づいて回答を生成 させる。 19
RAG の価値:2 つの世界の架け橋 RAGは、2つの異なる世界を繋ぐアーキテクチャ上の「架け橋」。 確率論的な世界: LLM(創造的だが、時に不正確) 決定論的な世界: データベース(事実に基づき、常に正確) 決定論的な検索システムが、確率論的な生成システムに「 ガードレール」を提
供する。 これにより、企業は 信頼できるAIを実現できる。 20
第5 章: エージェントAI 自ら考え、行動するAI AIが受動的なツールから、 能動的な主体へと進化。 高レベルの目標を与えると、自ら計画を立て、ツールを使い、タスクを遂行す る自律的なシステム。 21
エージェントの思考・行動サイクル 4つのステップを自律的に繰り返すことで、複雑なタスクを遂行する。 1. 知覚 (Perception): 環境から情報を収集する(メール、DB、Webなど)。 2. 推論と計画 (Reasoning &
Planning): 目標をサブタスクに分解し、実行計画を 立てる。 3. 行動 (Action): 外部のツールやAPIを呼び出し、計画を実行する。 4. 省察 (Reflection): 結果を評価し、必要であれば計画を修正する。 22
エージェントAI = 知性の司令塔 これまで議論してきたAI概念を統合し、指揮する「 オーケストレーター」。 脳: LLM 情報収集: RAG タスク実行:
生成AIや外部ツール 比喩: プロジェクトマネージャー プロジェクト目標を理解し、計画を立て、専門家(他のAI)にタスクを割 り振り、進捗を管理して成功に導く。 23
知性の「アプリケーション層」 エージェントAIは、AIの知性を具体的な「仕事」に変換するアプリケーション 層。 パラダイムシフト: 旧: 人間が個別のタスクを指示 (直接操作) (例:「請求書を作成」ボタンを押す) 新: 人間が目的を委任
(意図の委任) (例:「月末の請求処理を完了させておいて」と指示する) 人間は、知的作業の「 監督者」「 戦略家」へと役割が変わる。 24
第6 章: MCP (Model Context Protocol) AI エージェントを繋ぐ共通言語 新たなボトルネック: 連携したいツールごとにAPI仕様が異なり、接続が煩雑に
なる「 ツールのバベルの塔」問題。 これを解決し、真のAIエコシステムを構築するための標準規格。 25
解決策:MCP = AI のためのUSB-C 役割: AIエージェントと外部ツールとの通信方法を標準化するオープンなプロ トコル。 比喩: AI のためのUSB-C
ポート かつてデバイスごとに異なっていた充電ケーブルがUSB-Cで統一されたよ うに、MCPはAIとツールの接続を標準化する。 MCPに準拠していれば、どんなツールでもどんなエージェントにも「 プラ グアンドプレイ」で接続可能になる。 26
MCP が拓く未来:「エージェント経済圏」 影響: MCPは、将来の「 エージェント経済圏 (Agent Economy)」の誕生を可能 にする。 HTTPがWebサイト市場を、App Storeがモバイルアプリ市場を創出したよう
に、MCPはAIエージェントとツールの市場を創出する。 未来像: 特定タスクに特化した「専門家エージェント」が登場。 「元請けエージェント」が、市場から最適な専門家エージェントに業務を 委託し、協業して複雑な問題を解決する。 27
結論:壮大なる統合とAI の未来 6つの概念は独立せず、一つの統合されたワークフローとして連携する。 1. 人間が高レベルの目標を エージェントAIに与える。 2. エージェントはLLMを脳として計画を立案。 3. RAGで最新・正確な情報を収集。
4. MCPを通じて外部の専門ツール( 生成AIなど)を呼び出す。 5. Transformerベースの各AIが連携し、目標を達成する。 28
ご清聴ありがとうございました 29