Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TransformerからMCPまで(現代AIを理解するための羅針盤)
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
MIKIO KUBO
October 22, 2025
Programming
11
8.5k
TransformerからMCPまで(現代AIを理解するための羅針盤)
MIKIO KUBO
October 22, 2025
Tweet
Share
More Decks by MIKIO KUBO
See All by MIKIO KUBO
The Fusion of Mathematical Optimization and AI (MOAI): History and Outlook (Final Version)
mickey_kubo
0
63
The Fusion of Mathematical Optimization and AI (MOAI): History and Outlook (Short Version)
mickey_kubo
1
48
The Fusion of Mathematical Optimization and AI (MOAI): History and Outlook
mickey_kubo
1
88
History and Future of MO+AI
mickey_kubo
1
75
History and Future of MO+AI (Fusion of Mathematical Optimization and Artificial Intelligence)
mickey_kubo
1
40
Next.js 入門解説: Reactとの決定的な違いとApp Routerに基づくモダンWeb開発
mickey_kubo
1
130
Google Antigravity and Vibe Coding: Agentic Development Guide
mickey_kubo
8
390
React完全入門
mickey_kubo
1
120
TypeScript初心者向け完全ガイド
mickey_kubo
1
140
Other Decks in Programming
See All in Programming
[KNOTS 2026登壇資料]AIで拡張‧交差する プロダクト開発のプロセス および携わるメンバーの役割
hisatake
0
330
カスタマーサクセス業務を変革したヘルススコアの実現と学び
_hummer0724
0
830
ノイジーネイバー問題を解決する 公平なキューイング
occhi
0
120
Oxlint JS plugins
kazupon
1
1.1k
Vibe Coding - AI 驅動的軟體開發
mickyp100
0
190
Best-Practices-for-Cortex-Analyst-and-AI-Agent
ryotaroikeda
1
120
Package Management Learnings from Homebrew
mikemcquaid
0
240
2026/02/04 AIキャラクター人格の実装論 口 調の模倣から、コンテキスト制御による 『思想』と『行動』の創発へ
sr2mg4
0
500
Event Storming
hschwentner
3
1.3k
「ブロックテーマでは再現できない」は本当か?
inc2734
0
1.1k
20260127_試行錯誤の結晶を1冊に。著者が解説 先輩データサイエンティストからの指南書 / author's_commentary_ds_instructions_guide
nash_efp
1
1k
Gemini for developers
meteatamel
0
120
Featured
See All Featured
KATA
mclloyd
PRO
34
15k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.2k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
77
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
460
Design in an AI World
tapps
0
150
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.6k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
62
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
37k
Un-Boring Meetings
codingconduct
0
210
The Invisible Side of Design
smashingmag
302
51k
Transcript
現代AI を理解するための羅針盤 Transformer からMCP までの全貌解説 1
はじめに:現代AI を理解する旅 目的: 複雑なAI専門用語を解き明かし、6つの核心概念を一つの物語として理解 する。 旅のルート: i. Transformer: すべての始まり ii.
LLM: 巨大なデジタル知性 iii. 生成AI: 無限の創造性 iv. RAG: 現実への接地 v. エージェントAI: 自律的な行動 vi. MCP: 協調する生態系 2
AI が遂げる「三重の進化」 進化の潮流: i. 計算 (Computation) → 認知 (Cognition) ii.
生成 (Generation) → 行動 (Action) iii. 孤立 (Siloed Systems) → 協調 (Collaborative Ecosystem) インターネットとの類似性: AIも階層的な技術スタックを形成している。 3
第1 章: Transformer すべての土台となる革命的技術 2017年に発表された、現代AIの礎石。 Transformer以前と以後で、自然言語処理 (NLP)の世界は一変した。 4
Transformer 以前の課題:逐次処理の壁 主役: RNN (再帰型ニューラルネットワーク) 課題: i. 長期依存性の問題: 文が長くなるほど、文頭の情報を「忘れてしまう」。 (例:長い話の前提を忘れてしまう状態)
ii. 並列化の困難性: 一語ずつ処理するため、GPUの並列処理能力を活かせない。 モデルの訓練に膨大な時間がかかっていた。 5
中核的革新:アテンション機構 発想: 文中の単語を「同時」に処理し、単語間の関連性を計算する。 仕組み: 重要な単語に「注意 (Attention)」を向け、文脈を正確に捉える。 比喩: ウェブ検索 (Query, Key,
Value) Query (Q): 検索したい単語 (あなた) Key (K): 関連性を示す見出し (ウェブページのタイトル) Value (V): 意味そのもの (ウェブページの本文) 6
Transformer のその他の工夫 マルチヘッド・アテンション: 複数の「アテンション」で、文脈を多角的に捉える。 比喩: 専門家ぞろいの探偵チーム (指紋、アリバイ、動機など) 位置エンコーディング: 同時処理で失われた「語順」情報を補う。 比喩:
各単語に「座席番号」を付与する。 7
革命的インパクト:スケールの解放 最大の功績: 逐次処理の制約からAIを解放し、 完全な並列処理を可能にした。 結果: GPUの性能を最大限に引き出すことに成功。 モデルの巨大化と性能向上の好循環( スケーリング則)が生まれる。 → 大規模言語モデル
(LLM) の誕生へ 8
第2 章: 大規模言語モデル (LLM) 言葉を操る巨大な知性 Transformerというエンジンを使い、「規模(スケール)」を追求した結果。 ChatGPT, Gemini 9
LLM とは何か? 核心タスク: 「与えられた単語の次に、最も自然に来る単語を予測する」 (例:「吾輩は猫である。名前はまだ__」 → 「無い」 ) この単純なタスクを極めることで、文法、事実、論理的推論能力などを獲得す る。
「大規模」の正体: i. パラメータ: モデルの脳内にある無数の「調整ダイヤル」。(GPT-3で1750 億個) ii. データ: インターネット上の膨大なテキスト。 10
スケールの魔法:創発的能力 モデルの規模がある閾値を超えると、教えられていない新しい能力が「 創発 (emerge)」する。 創発的能力の例: 要約 質疑応答 コード生成 数学的推論 これは「量質転化」の一例。
11
LLM は「文化の鏡」である 訓練データ: インターネットという人類の知識と表現の集合体。 意味: LLMは我々のデジタル文化を写し出す「鏡」。 光: 科学的知識、文学的創造性 影: 社会的偏見、誤情報、論理的誤謬(
ハルシネーション) 課題: この強力な鏡に何を映し、どう活用していくか? 12
第3 章: 生成AI 無から有を生み出す魔法 AIが分析ツールから、人間の創造性を拡張するパートナーへと変貌。 テキスト、画像、音楽、コードなど、あらゆるデジタルコンテンツを生成す る。 13
生成AI の位置づけ 生成AI とは: 学習したデータパターンに基づき、新しいオリジナルコンテンツ を生成するAIの総称。 LLM との関係: すべてのLLM は生成AI
の一種 しかし、すべての生成AI がLLM ではない LLMは、生成AIの中で「テキスト生成」に特化したサブカテゴリー。 14
テキストを超えた創造性の爆発 画像: DALL-E, Midjourney (プロンプトから画像を生成) 動画: Sora, Veo (テキストから動画を生成) 音声・音楽:
特定の作曲家スタイルで新曲を作成 コード: 自然言語の指示からプログラムを生成 3D モデル: 建築プランやゲームキャラクターを自動生成 合成データ: プライバシーが重要な領域で訓練用データを生成 15
生成AI = 「万能コンテンツエンジン」 本質: あるドメインに十分なデータがあれば、そのルールに従った新しい成果 物を自動生成できる。 インパクト: デジタルコンテンツの「第一稿」作成コストがゼロに近づく。 人間の役割は、より高度な知的作業へシフト。 創造
(Creation) → キュレーション (Curation), 戦略 (Strategy) 16
第4 章: RAG ( 検索拡張生成) AI を” 知ったかぶり” から” 専門家”
へ LLMの実用化における2つの致命的な弱点を克服する技術。 i. 知識の陳腐化 (Knowledge Cutoff) ii. ハルシネーション (Hallucination) 17
RAG による解決策:現実への接地 核心アイデア: LLMが回答を生成する前に、 外部の信頼できる知識ソースにア クセスさせる。 目的: LLMの回答を、リアルタイムかつ正確な情報に「 接地 (grounding)」さ
せる。 比喩: オープンブック・テスト ( 開本試験) 通常のLLM: 記憶だけが頼りの「閉本試験」 RAG: 教科書や資料を参照できる「開本試験」 18
RAG の3 ステップ・プロセス 1. 検索 (Retrieve) ユーザーの質問に基づき、外部の知識ベース(社内文書、DBなど)から関 連情報を探し出す。 2. 拡張
(Augment) 取得した情報を、元の質問文に付け加え「拡張プロンプト」を作成する。 3. 生成 (Generate) 拡張プロンプトをLLMに渡し、提供された事実にのみ基づいて回答を生成 させる。 19
RAG の価値:2 つの世界の架け橋 RAGは、2つの異なる世界を繋ぐアーキテクチャ上の「架け橋」。 確率論的な世界: LLM(創造的だが、時に不正確) 決定論的な世界: データベース(事実に基づき、常に正確) 決定論的な検索システムが、確率論的な生成システムに「 ガードレール」を提
供する。 これにより、企業は 信頼できるAIを実現できる。 20
第5 章: エージェントAI 自ら考え、行動するAI AIが受動的なツールから、 能動的な主体へと進化。 高レベルの目標を与えると、自ら計画を立て、ツールを使い、タスクを遂行す る自律的なシステム。 21
エージェントの思考・行動サイクル 4つのステップを自律的に繰り返すことで、複雑なタスクを遂行する。 1. 知覚 (Perception): 環境から情報を収集する(メール、DB、Webなど)。 2. 推論と計画 (Reasoning &
Planning): 目標をサブタスクに分解し、実行計画を 立てる。 3. 行動 (Action): 外部のツールやAPIを呼び出し、計画を実行する。 4. 省察 (Reflection): 結果を評価し、必要であれば計画を修正する。 22
エージェントAI = 知性の司令塔 これまで議論してきたAI概念を統合し、指揮する「 オーケストレーター」。 脳: LLM 情報収集: RAG タスク実行:
生成AIや外部ツール 比喩: プロジェクトマネージャー プロジェクト目標を理解し、計画を立て、専門家(他のAI)にタスクを割 り振り、進捗を管理して成功に導く。 23
知性の「アプリケーション層」 エージェントAIは、AIの知性を具体的な「仕事」に変換するアプリケーション 層。 パラダイムシフト: 旧: 人間が個別のタスクを指示 (直接操作) (例:「請求書を作成」ボタンを押す) 新: 人間が目的を委任
(意図の委任) (例:「月末の請求処理を完了させておいて」と指示する) 人間は、知的作業の「 監督者」「 戦略家」へと役割が変わる。 24
第6 章: MCP (Model Context Protocol) AI エージェントを繋ぐ共通言語 新たなボトルネック: 連携したいツールごとにAPI仕様が異なり、接続が煩雑に
なる「 ツールのバベルの塔」問題。 これを解決し、真のAIエコシステムを構築するための標準規格。 25
解決策:MCP = AI のためのUSB-C 役割: AIエージェントと外部ツールとの通信方法を標準化するオープンなプロ トコル。 比喩: AI のためのUSB-C
ポート かつてデバイスごとに異なっていた充電ケーブルがUSB-Cで統一されたよ うに、MCPはAIとツールの接続を標準化する。 MCPに準拠していれば、どんなツールでもどんなエージェントにも「 プラ グアンドプレイ」で接続可能になる。 26
MCP が拓く未来:「エージェント経済圏」 影響: MCPは、将来の「 エージェント経済圏 (Agent Economy)」の誕生を可能 にする。 HTTPがWebサイト市場を、App Storeがモバイルアプリ市場を創出したよう
に、MCPはAIエージェントとツールの市場を創出する。 未来像: 特定タスクに特化した「専門家エージェント」が登場。 「元請けエージェント」が、市場から最適な専門家エージェントに業務を 委託し、協業して複雑な問題を解決する。 27
結論:壮大なる統合とAI の未来 6つの概念は独立せず、一つの統合されたワークフローとして連携する。 1. 人間が高レベルの目標を エージェントAIに与える。 2. エージェントはLLMを脳として計画を立案。 3. RAGで最新・正確な情報を収集。
4. MCPを通じて外部の専門ツール( 生成AIなど)を呼び出す。 5. Transformerベースの各AIが連携し、目標を達成する。 28
ご清聴ありがとうございました 29