RAGをテーマに考える、LLMの認知アーキテクチャとソフトウェア設計

RAGをテーマに考える、LLMの認知アーキテクチャとソフトウェア設計 Takuya Kikuchi / Algomatic シゴラクAIカンパニー CTO 2024-06-19 -
LLM Night 〜⽣成AIソフトウェアアーキテクチャ〜

フィンテックスタートアップにおいて開発リードやVPoEとして開発組織構築を担当したほか、モバイルオーダープラットフォームを⼿がける Showcase GigではVPoTとして技術領域全般を管掌。2024年、AlgomaticにカンパニーCTOとして参画。ソフトウェア開発、設計、ドット絵が好き X: @_pochi
Algomatic シゴラクAIカンパニー CTO 菊池琢弥 / Takuya Kikuchi 2 © 2024 Algomatic Inc.

❶ RAGとは ❷ RAGつくってみた ❸ 認知アーキテクチャとLangGraph ❹ まとめ 6 アジェンダ

RAGとは 7

RAGとは • 外部のデータベースや知識をもとにした回答を⼤規模⾔語モデルに⽣成させる技術 © 2024 Algomatic Inc. 8 Algomatic
社内ドキュメント経費申請どうしたらいい？⼀般的にはこうだよ！経費申請どうしたらいい？このフォームから必要事項を記⼊して送ってね！検索検索結果 RAGなし RAGあり

RAGとは • RAGの営みをざっくり整理すると ◦ ユーザーの発話から「何を知りたいのか」を認識し ◦ 答えるために必要な情報を検索し ◦ 検索結果を踏まえ、正しくわかりやすい回答を⽣成する ©
2024 Algomatic Inc. 9 Algomatic 社内ドキュメント引っ越しました！このフォームから住所変更してね！検索検索結果

RAGつくってみた 10 （結構細かい話をしますが、雰囲気を感じていただければいいな、という意図でお話します）

© 2024 Algomatic Inc. 11 まずはピュアに実装してみる async function answer( //
ユーザー入力 message: Message, // チャット履歴 history: Message[]) { // ナレッジベースから知識を取得 const knowledge = await knowledgeBase.search(message); // LLMを呼び出して回答を生成し、回答 return await llm.call(message, history, knowledge); }

© 2024 Algomatic Inc. 13 精度評価結果から、改善案を考える検索精度に課題が⼤きいことがわかったので、そこを⾼める⼯夫をする 1. 検索⽤のクエリ改善 2.
質問への仮回答⽂を⽣成し、それをクエリに検索する（HyDE） async function answer2(message: Message, history: Message[], useHyDE: boolean) { // 検索精度を高めるためにクエリを整形する const refinedMessage = await refineQuery(message, history); // HyDEモードの場合、HyDEを使ってクエリを生成する const searchQuery = useHyDE ? await hydeQuery(refinedMessage) : refinedMessage; // ナレッジベースから知識を取得 const knowledge = await knowledgeBase.search(searchQuery); // LLMを呼び出して回答を生成 return await llm.call(message, history, knowledge); }

© 2024 Algomatic Inc. 14 まだまだ改善は続く ReﬁneQuery → 良い感じ。採⽤。 HyDE → 精度向上はあるものの回答にかかる時間が⻑くなり、体験悪化。オ
プション式にする。検索精度は依然として課題 → 検索空間を狭めるために「カテゴリ」という概念を導⼊してみる

© 2024 Algomatic Inc. 15 「カテゴリ推定」、「ユーザーに逆質問」という遷移が追加 async function answer3(message: Message,
history: Message[], useHyDE: boolean) { // 検索精度を高めるためにクエリを整形する const refinedMessage = await refineQuery(message, history); // カテゴリを推定する const estimatedCategory = await decideCategory(refinedMessage); // カテゴリが推定できなかった場合、質問内容をもう少し詳しく教えるように促す if (!estimatedCategory) { return "質問内容について、もう少し詳しく教えてください。 "; } // HyDEモードの場合、HyDEを使ってクエリを生成する const searchQuery = useHyDE ? await hydeQuery(refinedMessage) : refinedMessage; // ナレッジベースから知識を取得 const knowledge = await knowledgeBase.search(searchQuery); // LLMを呼び出して回答を生成 return await llm.call(message, history, knowledge); }

© 2024 Algomatic Inc. RAGシステムの複雑さを考えるこれまでの実装で複雑なところは... • 各ノードの実⾏処理 ◦ プロンプトエンジニアリング
◦ ナレッジ検索精度 • 判断と状態遷移 ◦ こんなとき、ユーザーに聞き返すべき？ ◦ こうなったらもう回答を⽣成すべき？ 17

© 2024 Algomatic Inc. 宣⾔的に記述してみた 21 “実⾏” と “判断” を宣⾔的に記述するようにしてみる
class EstimateCategoryNode implements Node { process(state: AgentState) { // カテゴリ推定する機能を実装 } plan(state: AgentState) { // カテゴリ判定に成功したかどうかを判定し、次の遷移先を決定 if (state.推定成功()) { return nodeOf("ナレッジ検索"); } else { return nodeOf("ユーザーに逆質問 "); } } } class RAG { ... async run() { while (true) { const node = this.currentNode; node.process(); this.currentNode = node.plan(); if(currentNode === END) { return state; } } } } const rag = new RAG([ new EstimateCategoryNode(), new RetrieveKnowledgeNode(), ...]) const result = await rag.run(); 実⾏と遷移の定義ノードを取りまとめるクラス RAG機能の呼び出し

© 2024 Algomatic Inc. どうだった？かなり実装および改善がしやすくなった • 「実⾏」と「遷移」が明確に分離されることで開発およびテストが容易になった ◦
「検索処理を新しいバージョンに⼊れ替えて試してみるか」などの実験も容易に • 状態遷移図がそのまま実装されているので、開発メンバー以外との仕様に関するディスカッションもしやすくなった 22

認知アーキテクチャとLangGraph 23

© 2024 Algomatic Inc. 認知アーキテクチャ OpenAI's Bet on a Cognitive
Architecture - LangChain Blog https://blog.langchain.dev/openais-bet-on-a-cognitive-architecture/ 24 AIがどのように情報を処理し、理解し、⾏動を決定するかという根本的なフレームワーク

© 2024 Algomatic Inc. 認知アーキテクチャ 25 種別処理のアウトプット次の処理選択
利用可能なシーケンス Code コードで記述コードで記述コードで記述 LLM Call LLMによる応答（単一呼び出し）コードで記述コードで記述 Chain LLMによる応答（複数呼び出し）コードで記述コードで記述 Router LLMによる応答 LLMによる選択（ただしループはしない）コードで記述 StateMachine LLMによる応答 LLMによる選択（ループあり）コードで記述 Agent LLMによる応答 LLMによる選択 LLMによる定義

利用可能なシーケンス Code コードで記述コードで記述コードで記述 LLM Call LLMによる応答（単一呼び出し）コードで記述コードで記述 Chain LLMによる応答（複数呼び出し）コードで記述コードで記述 Router LLMによる応答 LLMによる選択（ただしループはしない）コードで記述 StateMachine LLMによる応答 LLMによる選択（ループあり）コードで記述 Agent LLMによる応答 LLMによる選択 LLMによる定義 LLMを使わないアプリケーション Assistant API / GPTs

利用可能なシーケンス Code コードで記述コードで記述コードで記述 LLM Call LLMによる応答（単一呼び出し）コードで記述コードで記述 Chain LLMによる応答（複数呼び出し）コードで記述コードで記述 Router LLMによる応答 LLMによる選択（ただしループはしない）コードで記述 StateMachine LLMによる応答 LLMによる選択（ループあり）コードで記述 Agent LLMによる応答 LLMによる選択 LLMによる定義 RAGは現状これが多い

© 2024 Algomatic Inc. LangGraph 認知アーキテクチャにおける、StateMachineを実装するためのライブラリ NodeとEdge、およびStateを定義することで、宣⾔的に StateMachineを実装できる 28
const workflow = new StateGraph({ channels: graphState }); workflow.addNode("カテゴリ推定", (state: AgentState) => { // カテゴリ推定処理を記述 }); workflow.addNode("ナレッジ検索", (state: AgentState) => { // ナレッジ検索処理を記述 }); workflow.addEdge(START, "カテゴリ推定"); workflow.addConditionalEdges("カテゴリ推定", (state: AgentState) => { if (state.カテゴリ推定成功 ()) { return "ナレッジ検索"; } return "再質問"; });

まとめ 29

© 2024 Algomatic Inc. まとめ RAGシステム、最初はシンプルだが、やがて複雑なアプリケーションに変貌していく。 • 「アクション」と「状態遷移」そのものが関⼼ごと ◦
それらを変更しやすいアーキテクチャを⽬指そうこれらはRAGに限らず、LLMを活⽤する場合によく直⾯する • LLMは「動かしてみないとわからない」ことが多い ◦ 状態遷移やアクションは頻繁に変更したくなる ◦ ⾼速な試⾏錯誤がプロダクトの優位性にもつながる 30

© 2024 Algomatic Inc. まとめ (2) ⼀⽅、LLMアプリケーションのパターンを分類した「認知アーキテクチャ」という概念がある • StateMachineパターンの実装を⼿助けするLangGraphが便利そう
• RAGの実装経験から検討した設計とも合致 31

RAG、ほんとうに必要ですか「有給休暇って何⽇ですか」 → これは社内ドキュメントを検索したほうが早い 33

RAG、ほんとうに必要ですか RAGが「ありがたい」となるケースを考える 1. 「何がわからないかわからない → 検索クエリも思い浮かばない状態 2. 複数の情報ソースを統合する → 引っ越したけどどうしたら？ 3. 対話形式での情報取得 → プログラミングなど 34

RAGをテーマに考える、LLMの認知アーキテクチャとソフトウェア設計

RAGをテーマに考える、LLMの認知アーキテクチャとソフトウェア設計

takuya kikuchi

More Decks by takuya kikuchi

Featured

Transcript