Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGにベクトルDBは必要ない!DBも不要で運用めちゃ楽な RAG Chatbot を作った話
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
forrep
August 20, 2024
Programming
18k
38
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
RAGにベクトルDBは必要ない!DBも不要で運用めちゃ楽な RAG Chatbot を作った話
forrep
August 20, 2024
More Decks by forrep
See All by forrep
サービスに組み込むAIのパターン/アンチパターン
forrep
0
120
Linux && Docker 研修/Linux && Docker training
forrep
28
5.8k
Google Analytics でサイト速度を計測する / Measure site speed with Google Analytics
forrep
2
440
最近コードレビューで指摘したこと
forrep
4
620
「プログラマーのためのCPU入門」は入り口として丁度よい!
forrep
54
38k
DevTools でパフォーマンスチューニング入門 / Introduction to Performance Tuning with DevTools
forrep
2
530
技術的負債に対する視力を得る / How to View Technical Debt
forrep
0
940
しくじり先生 - NFS+sqliteで苦労した話から学ぶ、問題解決の考え方 / problem-solving approach
forrep
1
1.4k
理屈で考える、データベースのチューニング / Database tuning How-To
forrep
28
9.7k
Other Decks in Programming
See All in Programming
そのテスト、説明できますか?~LWテスト戦略FW~のご紹介
nakahara
0
140
The NotImplementedError Problem in Ruby
koic
1
810
TypeScript+Orvalで実現する型安全かつ堅牢でスケーラブルなマルチチャネル通知基盤 / TSKaigi Night talks ~after conference~
d0riven
0
340
PHPで使える日時の表現と、その知り方 #frontend_phpcon_do
o0h
PRO
0
250
例外の正しい扱い方 そのエラー try-catchして大丈夫?
jinwatanabe
0
250
JJUG CCC 2026 Spring: JSpecify で実現する Kotlin フレンドリーな Java API 設計
ternbusty
1
170
3Dシーンの圧縮
fadis
1
770
Agentic UI
manfredsteyer
PRO
0
170
キャリア迷子上等 ─ "ない道"は自分で作ればいい
16bitidol
3
2.1k
Composerを使ったサプライチェーン攻撃の様子を眺めてみる #phpstudy
o0h
PRO
2
250
Honoでのサプライチェーン侵害対策 〜 3つのライブラリに学ぶ
yusukebe
6
1.3k
Language Server 使ってる? 〜VSCode と Zed の場合〜 / Are you using a Language Server? ~For VS Code and Zed~
handlename
0
790
Featured
See All Featured
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.5k
The browser strikes back
jonoalderson
0
1.3k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
6k
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
730
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.6k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.2k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
840
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
Building AI with AI
inesmontani
PRO
1
1.1k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
62
44k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Transcript
RAGにベクトルDBは必要ない! DBすら不要で運用の楽な RAG Chatbot を作った話 1 株式会社ラクーンホールディングス 技術戦略部 羽山純
自己紹介 • 名前 ◦ 羽山 純(Jun Hayama) ◦ @forrep •
所属 ◦ 株式会社ラクーンホールディングス • 技術領域 ◦ バックエンド・インフラ ◦ パフォーマンス改善 ▪ MySQLでプライマリキーをUUIDにする前に知っておいて欲しいこと ◦ AI(企業審査AI) • 個人活動 ◦ アプリ開発 2
はじめに 本日伝えたいことはたったの一つ RAG にベクトルDBは必要ない! それだけです 3
やりたかったこと 社内の知見を持つチャットボットがほしい (工数を掛けずに簡単に) 4
できたもの 5
できたもの 6 (1) 社内の知見を持っている (2) 詳しい人にパスしてくれる (3) 参考情報を引用してくれる
実現方法 社内の知見を蓄えたチャットボットの実現には以下が候補です • RAG(Retrieval-Augmented Generation) • ファインチューニング • RAG +
ファインチューニング 今回は RAG を利用します 7
LLM + RAG の標準的な構成 8 LLM 社内情報 ベクトルDB 先月発生したインシデントを教えて インシデント
以下は先月発生したインシデントのいくつかです。 1. ◦◦システム全体の動作不安定 (2024-07-22) • 発生期間: 2024/7/22 6:44~ • 詳細: ◦◦チェックAPIで扱うテーブルのデータが膨大になりDBのリソースをひっ迫して いることが原因でした。 • リンク: 詳細はこちら 2. sitemap.xmlが表示されない件 (2024-07-18) • 発生期間: 2024-7-16 14:00 ~ • 詳細: クローラーが見に行くsitemap.xmlがNginxの設定不足で表示されませんでした。 • リンク: 詳細はこちら その他のインシデント情報もありますので、詳細が必要であればお知らせください。
ベクトルDB が必要 RAG にはベクトルDBが必要らしい・・・ 9
ベクトルDB とは ベクトルDBは意味の 近いワードを検索できて、 RAG に最適です 10 社内情報ベクトルDB 「インシデント」で検索 問題
インシデント 事故 incident report 障害 不具合 トラブル システム障害 システムトラブル エラー issue ログ 異常 対立 不調 争い 妨害 支障 欠陥 短所 アクシデント 異変 problem
ベクトルDBはめんどくさい ベクトルDBを用意して、必要な情報を精査して、 常に最新情報を同期するのが・・・ めんどくさい データも膨大で無理 できればベクトルDBを使いたくない 11
たいていの情報は Slack にある Slack って社内情報の宝庫では? しかし Slack API の検索機能は単純な全文検索 12
検索ワードを ベクトルライクな方法で多 重化して、 何度か検索すれば、 Slack API の貧弱な検索で もベクトルDBと同等の結 果を得られます 逆ベクトル検索(仮)を採用
13 Slack ワークスペース 問題 インシデント 事故 incident report 不具合 システム障害 エラー issue ログ システムトラブル トラブル 障害 対立 不調 異常 争い 妨害 支障 欠陥 アクシデント 異変 短所 problem
検索ワードの多重化は LLM にやってもらう 14 先月発生したインシデントを教えて ユーザーの質問に答えるため、私が Slack を検索して調べます 私の代わりに検索ワードをたくさん考えてください 幅広い結果を得るために、似た意味のワードも出力してください
after:yyyy-mm-dd before:yyyy-mm-dd で日付絞り込みできます • インシデント after:2024-07-01 before:2024-08-01 • システム 障害 after:2024-07-01 before:2024-08-01 • インシデントレポート after:2024-07-01 before:2024-08-01 • 障害報告 after:2024-07-01 before:2024-08-01 • 不具合 after:2024-07-01 before:2024-08-01 • 障害 after:2024-07-01 before:2024-08-01 システムプロンプト LLM ユーザープロンプト ※ Function Calling を利用せず、手動で RAG を実施してます (理由は時間の関係で省略)
LLM に回答を生成してもらう LLM が生成してくれたワードを Slack API で検索して、 その結果を再度 LLM に入力して回答を生成します
15
そうすると、これくらいの精度で回答できる 16
まとめ RAG にベクトルDBは必要ない! それだけです 今回紹介した Chatbot は以下の TechBlog 記事で詳しく紹介しています 社内用AIアシスタント「おっさんずナビ」を作った話、そして人間らしく振る舞う重要性を認識した話
https://techblog.raccoon.ne.jp/archives/1719796918.html 17