Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
社内LT RAG・AIエージェントについて
Search
tetutetu214
January 25, 2025
1.6k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
社内LT RAG・AIエージェントについて
tetutetu214
January 25, 2025
More Decks by tetutetu214
See All by tetutetu214
自分なりの「技術のおとしこみ方」を振り返る
tetutetu214
1
89
AWS re:Invent 2025参加 直前 Seattle-Tacoma Airport(SEA)におけるハードウェア紛失インシデントLT
tetutetu214
2
150
re:Invent 2025 ~何をする者であり、どこへいくのか~
tetutetu214
0
280
AWS Summitとは?
tetutetu214
2
2k
AWS Summit Japan2025 の歩き方
tetutetu214
5
3.3k
私流「技術力」についての考察
tetutetu214
0
110
社内LT re:Cap copmute!
tetutetu214
0
400
Featured
See All Featured
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
390
Exploring anti-patterns in Rails
aemeredith
3
410
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
GraphQLとの向き合い方2022年版
quramy
50
15k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
200
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.2k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
320
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
780
Joys of Absence: A Defence of Solitary Play
codingconduct
1
400
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Transcript
RAG・AIエージェントについて 2025年の生成AI動向 稲村鉄平 2025/01/25
LTの目的 目的: ・RAGについての説明 ・AIエージェントの説明 ・AWS での エージェント機能についての説明 対象: ・LLMとAIエージェントの違いが分からない方 話さない事:
・コード実装やコスト等の詳細設定について
$whoami 名前:稲村鉄平(いなむら てっぺい) X :@t9z_a(てつてつ) 経歴:2021年3月入社 エンジニア歴3年10か月 経験:クラウドアーキテクチャ 要件定義-運用まで対応。 現在、生成AIの要件・構築。
興味:クラウド・DevOps 趣味:サウナ 夢 :平等に機会がある世界をつくる
目次 1.2024年ふりかえり ~RAG~ 2.2025年のトレンド ~AIエージェント~ 3.Amazon Bedrockについて 4.AIエージェントの課題 5.まとめ
1.2024年ふりかえり ~RAG~ ▪RAGとは? 外部情報を取り込み、回答生成するための仕組み ▪RAGの仕組み 1.ユーザの質問 2.情報検索(Retrieval) :ベクトルDBから関連文書を取得 3.文脈統合(Augmentation):取得した文書をLLMに与える 4.回答生成(Generation)
:文書をもとにLLMが回答を生成 1.1.RAG(Retrieval Augmented Generation)について 検索 生成 ベクトルDB LLM(言語モデル) 2.情報検索 アプリケーション 3.文脈統合 4.回答生成 1.ユーザの質問 5.回答
1.2024年ふりかえり ~RAG~ ▪注目された理由の推測 生成AIに外部データを取り込ませる方法として、最も効率的だと思われる 1.2.なぜRAGが注目されたのか? プロンプト エンジニアリング RAG (検索拡張生成) ファイン
チューニング 独自モデル 開発 生成AIの プロンプトに 直接知識を挿入 ナレッジベースの 検索結果を 知識として与える 特定のタスクに 特化した能力を 調整する 大量の学習データ による知識を習得 ▪生成AIに外部情報を取り込ませる主な4つの方法 EASIER COMPLEX AWS AI Day 「基調講演 AWSのテクノロジーで加速する生成AIのプロダクション活用」参考
2.2025年のトレンド ~AIエージェント~ ▪定義 目標(ゴール)を与えると、タスクを自律的に分解・実行する 外部リソースも活用しながら、目標達成を目指すフレームワーク ▪特徴 ・タスク分解:目標を複数ステップに分割して計画 ・自己判断 :各ステップで最適なアクションを選択 ・状態管理
:進捗を内部で保持、必要に応じて方針修正 2.1.AIエージェントについて ▪企業 株価状況取得エージェント RAG 銘柄コード AIエージェント Web検索 企業情報取得 次のアクションは。。。
従来のLLM(生成AI) エージェント(AI Agent) 性質 大規模言語モデルとして テキスト生成を主目的としたモデル 目標(ゴール)に基づき、自律的にアクション も含め制御する仕組み(フレームワーク) タスク タスクをどう連続して実施するかは、
人が考えて制御し、 ツールやAPIは人が呼び出す 内部メモリと外部ツール連携を活用し、 目標(ゴール)に向けて、連続的にタスクを実行・ 評価・修正をエージェントが制御する 例:API呼び出し/WEB検索/ファイル操作など 状態保持 過去にやりとりをした 会話履歴レベルでの保持 実行したアクションの結果を内部メモリに保存、 保存内容を参照して行動を判断 とある サーベイ論文 脳(=推論) 脳 (=推論) 知覚 (=外部情報の取り込み) アクション(=プログラムで情報の取得) 2.2025年のトレンド ~AIエージェント~ 2.2. これまでのLLMとの違い サーベイ論文:The Rise and Potential of Large Language Model Based Agents: A Survey https://arxiv.org/abs/2309.07864
3.Amazon Bedrockについて ▪サービス紹介 AWSが提供する大言語モデルのフルマネージドサービス 生成AIモデルをサーバレスで、APIで呼び出して利用することが可能 3.1.Bedrockとは? ▪Amazon Bedrock Agents ・Bedrock上でエージェントフレームワークが簡単に利用できる
・各種LLM・外部サービスと連携しながらタスクを自動実行が可能 RAG Amazon Auroa Bedrock Agents Web検索 AWS Lambda https://www~ ▪企業 株価状況取得エージェント
3.Amazon Bedrockについて ▪マルチエージェントコラボレーション機能 re:Invent 2024で、プレビュー版として発表された機能 複数のエージェントを連携させ、高度なタスクの計画から解決まで実行が可能 3.2.Bedrock Agentsの新機能について RAG Amazon
Auroa 協力者エージェント Web検索 AWS Lambda Bedrock Agents ▪株購入エージェント ▪全社情報共有 システム ▪企業 株価状況取得エージェント 監督者 エージェント API Gateway 株購入API
4.AIエージェントの課題 ▪自動化範囲の定義 ・どのタスクをAIエージェントに任せるのかの定義が必要 ・どの段階で人間が承認/レビューをするか(Human in the loopの確立) ▪意思決定の責任所在 ・エージェントが誤判断した場合の責任は誰にあるのか? ▪監視・ログ管理
・エージェントが行った決定・外部サービス呼び出しの追跡ログの整備 ・「なぜ、その決定をしたのか?」を振返れる仕組みづくり ▪ガバナンス ・不適切なAPI呼び出しの制御(アクセス権限の制御) ・個人情報、機密データの取り扱いについて 4.1.課題と責任範囲
5.まとめ ▪RAGについて 外部情報を効率的に取込むことができる機能 ▪AIエージェントについて 目標(ゴール)を与えると、タスクを自律的に分解・実行するフレームワーク ▪Amazon Bedrock Agentsについて 新機能のマルチコラボレーション機能により、複数のエージェントを マネージドサービスで、制御・管理する機能が追加された
▪導入ポイント 責任分界点(自動化 と 人間の判断)の議論をしていかなければいけない
Thank you!