Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20260321_エンベディングってなに?RAGってなに?エンベディングの説明とGemini ...
Search
tsho
March 20, 2026
Technology
230
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20260321_エンベディングってなに?RAGってなに?エンベディングの説明とGemini Embedding 2 の紹介
Build with AI 2026 高松のイベント資料です
https://gdgshikoku.connpass.com/event/386377/
tsho
March 20, 2026
More Decks by tsho
See All by tsho
AI Agentにおける評価指標とAgent GPA
tsho
1
480
Scale SciPy with jax.shard_map - jax.shard_mapで SciPy をスケール
tsho
0
140
Developer Advocate / Community Managerなるには?
tsho
0
790
25/04/12 - Build with AI Hands-on Appendix
tsho
1
89
Unit testしてますか?
tsho
1
670
Other Decks in Technology
See All in Technology
[チョークトーク資料]AWS DevOps Agent を使いこなす / AWS Dev Ops Agent Chalk Talk AWS Summit Japan 2026
kinunori
0
150
2026 TECHFRESH 畢業分享會 - 開發日常大解密!從領域驅動到企業級上線
line_developers_tw
PRO
0
1.2k
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
400
プロダクト開発から業務改善コンサルまで。事業全体へ「染み出す」ことで広がるエンジニアの可能性
ham0215
0
130
フィジカル版Github Onshapeの紹介
shiba_8ro
0
270
脱SaaS!FDEを支えるプロビジョニングと分離設計
knih
0
120
On-behalf-of Token exchange with AgentCore Identity
hironobuiga
2
240
攻撃者視点で考えるDetection Engineering
cryptopeg
3
1.9k
Snowflakeと仲良くなる第一歩
coco_se
4
490
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
310
SONiCの統計情報を取得したい
sonic
0
190
人材育成分科会.pdf
_awache
4
280
Featured
See All Featured
Writing Fast Ruby
sferik
630
63k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
Chasing Engaging Ingredients in Design
codingconduct
0
220
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
230
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
590
WENDY [Excerpt]
tessaabrams
11
38k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.2k
The Limits of Empathy - UXLibs8
cassininazir
1
360
Embracing the Ebb and Flow
colly
88
5.1k
We Have a Design System, Now What?
morganepeng
55
8.2k
Transcript
Build with AI, GDG 四国 エンベディングってなに?RAGってなに? エンベディングの説明と Gemini Embedding 2
の紹介
- Lead Developer Advocate @ Snowflake - ex-Google gTech Ads,
ML/Data - MLOps community 運営 (2020~) - Google Developer Expert, AI/ML - 事業会社などにて分析からML/AIの適用な どについて取り組む tsho / 田中 翔 (Sho Tanaka) Linkedin.com/in/tsho
エンベディング (Embedding) とは?
Source: xxxxx エンベディング(埋め込み) とは、テキストの意味を数値で表現したもので、AI が単語間の文脈や関連性を理解できるようにする技術です。 { 0.6, 0.8 } Dimensions
(次元)
Source: xxxxx “王様” { 0.6, 0.8 }
王様 女王様
王様 女王様 車
遠 い =似 てい ない 近 い =似 て い
る
エンベディングの 適用例とRAG
Source: xxxxx 文章内のすべての単語のエンベディングを 単純に平均化したい誘惑に駆られるかもし れませんが、単語の順序や文法を無視する ためあまり有用ではありません。なぜなら 「犬が人間を舐める」という文は、「人間が犬 を舐める」という文と同じではないからです。 Embeddings 文章には繊細なアプローチが必要
Source: xxxxx 大規模なデータセットでトレーニングされており、単語 間の複雑なパターンや関係性を理解することができま す。これらのモデルは、元の入力テキストのニュアンス や意味を正確に表現するエンベディングを生成するよ うに構築されています。 Embeddings Embedding models
dog licks man [0.47, …] [0.31, …] [0.96, …] subject verb object man licks dog [0.96, …] [0.31, …] [0.47, …] subject verb object is not
Source: xxxxx セマンティック検索 キーワードだけでなく、意味によって結果を見 つけます。(例:「夏の服」で検索すると、 「ショートパンツ」や「Tシャツ」が見つかりま す。) レコメンデーションエンジン 類似のアイテム、記事、または曲を提案しま す。(「これを読んだユーザーはこれも気に入り
ました」など。) クラスタリング & 分類 類似のドキュメントをグループ化したり、テキス トを自動的に分類したりします(例:サポートチ ケットを「請求」または「技術」に分類するな ど)。 Retrieval-Augmented Generation (RAG) 検索拡張生成 LLMを事実に根付かせ、「持ち込み可の試験 (オープンブック形式の試験)」を受けさせる。 Embeddings 適用例
Source: xxxxx Embeddings Retrieval-Augmented Generation (RAG) エンベディングモデルの支援を受けて検索さ れた外部情報に基づいてLLM(大規模言語モ デル)の回答を根拠づけることで、LLMを強化 します。
Source: xxxxx システム User モデル Response 私は現時点で2025 3月までの知識しか 持っておりませんので回答できません。 Prompt
2026/3月時点誰が 首相ですか? 私は現時点で2025 3月までの知識しか 持っておりませんので回答できません。
Source: xxxxx システム User モデル Response My knowledge cutoff was
March 2024, so... I don’t know. RAG system Embedding Model Database RAG system lookup request Prompt + RAG system function declarations RAG system response 2026/3月時点誰が 首相ですか? 高市さんです
チュートリアル
Source: xxxxx 高性能なテキストエンベディングを作成するため の、強力なホスト型モデルです。MRL(Matryoshka Representation Learning)機能を備えており、柔 軟な出力次元に対応し、より小さなエンベディング (1536、768)を含む3072次元のエンベディングを生 成します。 Embeddings
Gemini Embedding 2 Mar 10, 2026・hosted model ブログ: Gemini Embedding 2: Our first natively multimodal embedding model
Source: xxxxx Embeddings | Gemini Embedding 2 Embedding チュートリアル このチュートリアルでは、Gemini
Embedding 2を使用して、画 像、動画などの一連のベクトル化、類似度計算を確認していく チュートリアルです。 https://github.com/t sho/2026-bwai-ge mini-embeddings
Source: xxxxx Embeddings まとめ • エンベディングは、テキストのセマンティックな意味を数値で表現したも のです。 • RAGは、LLMを最新にし、事実に根付かせる (groundings)
強力な技 術です。 • Googleは、エンベディングに関する幅広いソリューションを提供してお り、特に Gemini Embedding 2が現在最新のソリューションです。
Build with AI Thank you