Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
10分で学ぶ、RAGの仕組みと実践
Search
Marimo
April 30, 2025
Technology
0
1.1k
10分で学ぶ、RAGの仕組みと実践
2025/4/24 CDLE北海道主催RAGを実装してみよう!ミニハンズオン会のセミナー資料です
Marimo
April 30, 2025
Tweet
Share
More Decks by Marimo
See All by Marimo
ゼロから学ぶ! MCP入門ハンズオン
supermarimobros
1
700
Other Decks in Technology
See All in Technology
より良いプロダクトの開発を目指して - 情報を中心としたプロダクト開発 #phpcon #phpcon2025
bengo4com
1
3.1k
How Community Opened Global Doors
hiroramos4
PRO
1
120
Snowflake Summit 2025 データエンジニアリング関連新機能紹介 / Snowflake Summit 2025 What's New about Data Engineering
tiltmax3
0
310
Oracle Cloud Infrastructure:2025年6月度サービス・アップデート
oracle4engineer
PRO
2
240
AIの最新技術&テーマをつまんで紹介&フリートークするシリーズ #1 量子機械学習の入門
tkhresk
0
140
なぜ私はいま、ここにいるのか? #もがく中堅デザイナー #プロダクトデザイナー
bengo4com
0
410
Javaで作る RAGを活用した Q&Aアプリケーション
recruitengineers
PRO
1
110
Observability infrastructure behind the trillion-messages scale Kafka platform
lycorptech_jp
PRO
0
140
AWS Summit Japan 2025 Community Stage - App workflow automation by AWS Step Functions
matsuihidetoshi
1
260
Node-REDのFunctionノードでMCPサーバーの実装を試してみた / Node-RED × MCP 勉強会 vol.1
you
PRO
0
110
AWS CDK 実践的アプローチ N選 / aws-cdk-practical-approaches
gotok365
6
740
Model Mondays S2E02: Model Context Protocol
nitya
0
220
Featured
See All Featured
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.3k
Building Adaptive Systems
keathley
43
2.6k
[RailsConf 2023] Rails as a piece of cake
palkan
55
5.6k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.5k
Stop Working from a Prison Cell
hatefulcrawdad
270
20k
Intergalactic Javascript Robots from Outer Space
tanoku
271
27k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2.1k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
Designing for humans not robots
tammielis
253
25k
Done Done
chrislema
184
16k
Transcript
RAGを実装してみよう!ミニハンズオン会 10分で学ぶ、RAGの仕組みと実践 CDLE北海道 池田広樹
自己紹介 池田 広樹 札幌市在住のエンジニア 大学時代に生化学分野で多変量解析を経験 代謝物の網羅的解析の分野 昨年、 「E資格チャレンジ」でE資格取得 その他、AIコンペのKaggleや松尾研LLM2024など に参加してます
①RAGの概要
①RAGの概要 LLMが外部知識に基づき回答する技術 最新の知識を反映、ハルシネーションを抑えるなどの効果 検索部位(Retriever)と生成部位(Generation)に分かれます 池田広樹って何者? 問い合わせ(クエリ) DB 外部知識 池田広樹は札幌在住のエン ジニアで・・・
池田広樹はPython/Flutter が得意です・・ 関連した文章 検索部位 (Retriever) RAG (Retrieval-Augmented Generation: 検索拡張生成)
①RAGの概要 池田広樹は札幌在住のエン ジニアで・・・ 池田広樹はPython/Flutter が得意です・・ 関連した文章 池田広樹って何者? 以下の情報を参照して答えてく ださい 池田広樹は札幌在住のエン
ジニアで・・・ 池 田 広 樹 は Python/Flutter が得意です・・ 池田広樹は札幌在住 のエンジニアで、 Python/Flutterが得 意です。 生成部分 (Generation) RAG (Retrieval-Augmented Generation: 検索拡張生成) LLMが外部知識に基づき回答する技術 最新の知識を反映、ハルシネーションを抑えるなどの効果 検索部位(Retriever)と生成部位(Generation)に分かれます
②検索部位(Retriever)
RAGは検索が重要 → どれだけ問い合わせ(クエリ)に関連した文章を見つけられるか ②検索部位(Retriever) インデックス検索 埋め込みベクトルの類似度・距離計算 コサイン類似度, ユークリッド距離(L2ノルム) ... キーワード検索
単語の出現頻度に基づいて類似度を計算 TF-IDF, BM25 知識グラフ GraphRAG
②検索部位(Retriever) インデックス検索 埋め込みベクトルの類似度・距離計算 コサイン類似度, ユークリッド距離(L2ノルム)... 意味的に似てる 意味的に似てない 池田広樹って何者? [0.0228, -0.1749,
0.1850, -0.1225, 0.1583, -0.6414, -0.0728, 0.6913] 埋め込みモデルによってベクトル変換 池田広樹は札幌在住のエンジニアで・・・ 池田広樹って何者? CDLE北海道では、北海道でAIに興味のある方々を・・・
②検索部位(Retriever) キーワード検索 単語の出現頻度に基づいて類似度を計算 TF-IDF, BM25 池田広樹って何者? [池田, 広樹, 何者] 池田広樹は札幌在住のエンジニアで・・・
[池田, 広樹, 札幌, 在住, エンジニア...] CDLE北海道では、北海道でAIに興味のある方々を・・・ [CDLE北海道, 北海道, AI, 興味, ある, 方々...] 単語が一致するほどスコアが高く、 珍しい単語はスコアが高い 高スコア 低スコア
③ハンズオンの流れ
③ハンズオンの流れ 1部:RAGの基本原理を学ぶ (30分) 埋め込みベクトルに触れる RAGの検索部分(Retriever)に触れる インデックス検索の基礎 キーワード検索の基礎 ハイブリット検索(インデックス検索とキーワード検索の融合)に触れる 2部:langchainを使って、実践的なRAGに触れる (20分)
Chunking: 文章を小さな単位(チャンク)に分割するプロセス langchainの「チェイン」を使ったRAGの構築 RAGの定量的な評価(RAGAS)
🎯 それでは実際に手を動かしてみましょう!