Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
IR Reading 2024秋 論文紹介「MeMemo On-device Retrieva...
Search
AITC - DENTSU SOKEN
November 10, 2024
0
360
IR Reading 2024秋 論文紹介「MeMemo On-device Retrieval Augmentation for Private and Personalized Text Generation」
https://sigirtokyo.github.io/post/2024-11-09-irreading_2024fall/
AITC - DENTSU SOKEN
November 10, 2024
Tweet
Share
More Decks by AITC - DENTSU SOKEN
See All by AITC - DENTSU SOKEN
電通総研のLLMエージェントの技術開発や製造のAI活用事例紹介
isidaitc
2
1.6k
生成AIエージェントの現状を俯瞰する
isidaitc
0
5.3k
Azure AI Search入門 - 基本概念理解からAzure OpenAI Searchとの連携まで
isidaitc
4
17k
文章分類モデルの不確実性に基づく人間によるデバッグ手法の提案
isidaitc
0
1.4k
エンジニアリングへのAI適用状況について
isidaitc
0
2.3k
AI組織でのアプリケーション開発の裏側- Django × DDDでの開発プラクティス
isidaitc
0
1.9k
アジャイルとユースケース駆動開発を統合したプロセスを実践してみた
isidaitc
1
2.2k
実践Azure DevOps〜Azure DevOpsクイックツアーとBoardsを少々〜
isidaitc
0
1.6k
AIのPoCを次に繋げよう!PoC成果をプロトタイプとしてデプロイする仕組みを紹介
isidaitc
0
1.1k
Featured
See All Featured
Docker and Python
trallard
42
3.1k
Large-scale JavaScript Application Architecture
addyosmani
510
110k
Git: the NoSQL Database
bkeepers
PRO
427
64k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
127
18k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
132
33k
How to Think Like a Performance Engineer
csswizardry
22
1.2k
The Pragmatic Product Professional
lauravandoore
32
6.3k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.7k
Designing Experiences People Love
moore
138
23k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
48k
Transcript
SIGIR2024(Best Short Paper Award, Honorable Mention) MeMemo: On-device Retrieval Augmentation
for Private and Personalized Text Generation Zijie J. Wang and Duen Horng Chau ( Georgia Institute of Technology , Atlanta, Georgia, USA) 株式会社電通総研 X(クロス)イノベーション本部 テクノロジー&イノベーションユニット AIトランスフォーメーションセンター 村本 直樹 IR Reading 2024 秋
2 この論文の貢献は? (RAGのための) クライアントサイドで完結する データ保存・近似最近傍探索※ツールを開発 ※Hierarchical Navigable Small World
一般的なRAGシステム 知識拡張のためのデータ保存・検索の仕組みはサーバサイドにある RAGシステム(サーバサイド) Step1:質問内容に関連する 文書の取得 関連 文書 質問内容 クライアントサイド Step2:LLMモデルによる
回答生成 知識の拡張 回答 リクエスト
4 一般的なRAGシステムにおける課題 ▍データプライバシーの課題 秘匿性の高いデータはサーバサイドに置くにあたって制限が多い (クラウドサービスなどであればリージョンの制限など) ▍ユーザの利用しやすさと技術的なハードル ⚫ DBや検索基盤を構築するまでのハードルが高い ⚫ クラウドなどを活用する方法もあるがクライアントサイドで完結させたい
⚫ 限られたリソースとなるクライアントサイドでのデータ検索には、 データ管理や検索処理の工夫が必要
クライアントサイド MeMemoが実現したこと HNSWによる文書検索の仕組みを データ管理も含めクライアントサイドで完結させた IndexedDBに ベクトルなどを保存 質問内容 LlamaやPhiなどの ローカルで動くLLM 回答
RAMでキーと HNSWグラフを保持 関連 文書 エンベディング GTE-Smallなど HNSWによる検索 LLMやエンベディング部分は サーバサイドにすることも可能
6 用語の軽い説明 ▍Hierarchical Navigable Small World(HNSW) ⚫ 高次元空間での近似最近傍探索を高速に行うことを目的とするアルゴリズム ⚫ グラフベースのアプローチで、複数の階層(レベル)にわたるリンクを
利用して効率的に探索を行う ⚫ ANN検索で最もよく使われるアルゴリズムの1つ ▍IndexedDB ⚫ ブラウザ内で利用でき、データの永続化可能なオブジェクト指向DB ⚫ オフライン環境でデータの読み書きが可能 ⚫ ストレージの上限やデータの破棄基準はブラウザに依存 ⚫ データ操作は非同期で行われ、トランザクションを使って整合性を保つ
7 クライアントサイドで実現するメリット ▍プライバシー問題の解決 クライアントでデータを保持するため、 外部サーバーにデータを送信する必要がなくなる ▍アクセス性 ブラウザで動作するため、PCやモバイルデバイスを含め、 IoTデバイス上での利用も可能になる ▍インタラクティブ性 外部との通信が発生せず、よりリアルタイムのデータ検索や
プロトタイピングが可能になる
8 サンプルアプリケーションも提供されている GitHub - poloclub/mememo: A JavaScript library that brings
vector search and RAG to your browser! githubから飛べるサンプル環境は検索がうまく使えないので、 ローカルに落としてちょっと手を加えて触ってみました…
9 実際にローカル環境で触ってみた※動画のためPDFでは見られません… ドキュメント数が少ない点を 考慮しないといけないがかなり早い印象 384次元、1000件のドキュメントに対し 1秒程度で検索
10 Indexed DBにドキュメント情報などを保存 ▍サンプルアプリケーションにて確認 開発者ツールにてIndexedDBに保存されているドキュメントを確認できる 各文書に対応するベクトル 各文書の中身
11 まとめ(個人的な感想) ▍エージェントなどLLMの活用の幅は広がっているが、 RAGの仕組みはよく使われており、気軽に試せるところがGood ⚫ DBや全文検索エンジンなどを裏側で持つのは実装、運用コスト的にも難しい ⚫ 外部との通信に関する問題がない点が気楽でよい ▍クライアント側の環境に大きく依存するので、 アプリケーションとして提供する場合は考慮事項が多い
⚫ エンベディングはバッチ処理的にしないとどうしても時間がかかるので、 大規模に保存する場合は事前に用意するほうが良い (論文上で説明されている内容では)公式64GBのRAMを持つMacBook上でChromeを使用し、 384次元ベクトルで100万ドキュメントをインデックス化するのに約94分を要する ⚫ 当然サーバサイドに比べると容量や計算資源の問題から制約が多い (ドキュメントやベクトル次元数の上限等)