Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

RAG/Agent開発のアップデートまとめ

Avatar for sakai sakai
December 11, 2025

 RAG/Agent開発のアップデートまとめ

Avatar for sakai

sakai

December 11, 2025
Tweet

More Decks by sakai

Other Decks in Technology

Transcript

  1. ⾃⼰紹介 2 • 2023年11⽉ ◦ クラスメソッド⼊社 • 2024年10⽉〜  ◦ ⽣成AIを中⼼に技術⽀援やプリセールスを担当

    • 部署 ◦ クラウド事業本部コンサルティング部 • 名前 ◦ 酒井 貴央 • 出⾝‧住まい ◦ 神奈川 → 福岡 • ブログ ◦ DevelopersIO(酒井貴央) • 好きな技術 ◦ ⽣成AI全般
  2. 今⽇紹介するアップデート 5 • 2025-11-30 ◦ Multimodal retrieval for Bedrock Knowledge

    Bases now generally available • 2025-12-02 ◦ Amazon OpenSearch Service adds GPU-accelerated and auto-optimized vector indexes ◦ Amazon S3 Vectors is now generally available with 40 times the scale of preview ◦ Amazon Bedrock AgentCore Runtime now supports bi-directional streaming ◦ Amazon Bedrock AgentCore now includes Policy (preview), Evaluations (preview) and more • 2025-12-03 ◦ Announcing TypeScript support in Strands Agents (preview) and more
  3. RAG

  4. RAG関連のアップデート 7 • 2025-11-30 ◦ Multimodal retrieval for Bedrock Knowledge

    Bases now generally available • 2025-12-02 ◦ Amazon OpenSearch Service adds GPU-accelerated and auto-optimized vector indexes ◦ Amazon S3 Vectors is now generally available with 40 times the scale of preview ◦ Amazon Bedrock AgentCore Runtime now supports bi-directional streaming ◦ Amazon Bedrock AgentCore now includes Policy (preview), Evaluations (preview) and more • 2025-12-03 ◦ Announcing TypeScript support in Strands Agents (preview) and more
  5. Amazon Bedrock Knowledge Basesのマルチモーダル検索 8 マルチモーダル検索をサポート 画像‧⾳声‧動画に対応 処理⽅式は2種類から選択 • Nova

    Multimodal Embeddings ◦ ネイティブ形式を保持し直接埋め込 み • Bedrock Data Automation (BDA) ◦ テキスト表現に変換して埋め込み https://dev.classmethod.jp/articles/bedrock-kb- multimodal-search-ga/
  6. Amazon OpenSearch Serviceの機能強化① 9 GPU acceleration • インデックス構築速度が最⼤10倍向上 • インデックスコストが1/4に削減

    • Serverless GPUが動的に起動、使⽤時 のみ課⾦ • 対応バージョン ◦ OpenSearch 3.1以降、Serverless collections https://dev.classmethod.jp/articles/20251203-am azon-opensearch-service-gpu-acceleration-auto- optimize/
  7. Amazon OpenSearch Serviceの機能強化② 10 Auto-optimization • k-NNアルゴリズム、量⼦化、エンジン 設定を⾃動評価 • レイテンシとリコール要件を指定するだ

    けで最適化推奨を⽣成 • 対応バージョン ◦ OpenSearch 2.17以降、Serverless collections https://dev.classmethod.jp/articles/20251203-am azon-opensearch-service-gpu-acceleration-auto- optimize/
  8. Amazon S3 Vectorsの機能強化と⼀般提供開始 11 スケールとパフォーマンスが向上 最⼤90%コスト削減可能 • スケール ◦ インデックスあたり最⼤20億ベクトル

    (プレビュー⽐40倍) ◦ バケットあたり最⼤20兆ベクトル ◦ クエリあたり最⼤100件(プレビュー: 30件) • パフォーマンス ◦ 書き込み: 1,000 PUT/秒 ◦ クエリ遅延: 100ms〜1秒(⾼頻度ほど ⾼速) https://dev.classmethod.jp/articles/s3-vector-ga- tokyo-region-available-aws-reinvent/
  9. Agent関連のアップデート 13 • 2025-11-30 ◦ Multimodal retrieval for Bedrock Knowledge

    Bases now generally available • 2025-12-02 ◦ Amazon OpenSearch Service adds GPU-accelerated and auto-optimized vector indexes ◦ Amazon S3 Vectors is now generally available with 40 times the scale of preview ◦ Amazon Bedrock AgentCore Runtime now supports bi-directional streaming ◦ Amazon Bedrock AgentCore now includes Policy (preview), Evaluations (preview) and more • 2025-12-03 ◦ Announcing TypeScript support in Strands Agents (preview) and more
  10. Amazon Bedrock AgentCore Runtimeが双⽅向ストリーミングに対応 14 従来の⼀⽅向レスポンス → 対話的な エージェントへ •

    リアルタイム双⽅向通信を実現する WebSocketベースの機能 • ユーザーとエージェントが同時に発話、 受信可能 • 会話中の中断、訂正、⽅向転換をシーム レスに処理 • コンテキストを維持したまま継続的な対 話が可能 • ⾳声エージェント向けに最適化 https://dev.classmethod.jp/articles/bedrock-age ntcore-websocket-bidirectional-streaming/
  11. Amazon Bedrock AgentCore Evaluations 15 Agentの挙動を継続的に評価‧モニタリ ング • 13種類の組み込み評価指標とカスタム 評価が利⽤可能

    • LLM-as-a-Judgeによる⾃動評価 • 評価タイプ ◦ オンライン評価: 本番トラフィック を継続的に監視 ◦ オンデマンド評価:特定のインタラ クションを対象 https://dev.classmethod.jp/articles/agentcore-ev aluations/
  12. Policy in Amazon Bedrock AgentCore 16 ツールの呼び出しを制御 • ⾃然⾔語またはCedar(AWS製オープン ソースポリシー⾔語)でポリシー作成

    • OAuthクレーム(JWT)とツール⼊⼒パ ラメータに基づくきめ細かいアクセス制 御 • 2つの適⽤モード: LOG_ONLY(テスト ⽤)と ENFORCE(本番⽤) https://dev.classmethod.jp/articles/amazon-bedr ock-agentcore-policy-awsreinvent/
  13. Amazon Bedrock AgentCore Memory エピソード記憶 17 過去の経験から学習し類似タスクに適⽤ • 3ステップの処理パイプライ ◦

    Extraction: エピソード完了検出‧重 要情報抽出 ◦ Consolidation: 構造化レコードへの 統合 ◦ Reflection: パターン‧洞察の⽣成 https://dev.classmethod.jp/articles/amazon-bedr ock-agentcore-episodic-memory-strategy/
  14. Strands Agents SDKのアップデート① 18 Strands Agents がTypeScriptをサポー ト • ネイティブなTypeScript体験

    ◦ 型安全性 ◦ async/await ◦ Zodによる⼊⼒スキーマ検証 • 多様な実⾏環境
  15. Strands Agents SDKのアップデート② 19 Strands Agents SOPs • マークダウン形式でStandard Operating

    Procedures(作業⼿順)を 定義 • RFC 2119制約(MUST/SHOULD/MAY) で動作を精密制御 • MCP / Claude Skills / Strands Agents な ど多様な環境で利⽤可能
  16. Strands Agents SDKのアップデート③ 20 Strands Agents Steering • 課題: プロンプトの肥⼤化

    ◦ 指⽰の無視やハルシネーションの発⽣ • 解決策: 段階的開⽰(Progressive Disclosure) ◦ 適切なタイミングでガイダンスを提供 • SteeringAction ◦ Proceed: そのまま実⾏ ◦ Guide: キャンセル + フィードバック ◦ Interrupt: ⼈間の⼊⼒待ち
  17. Strands Agents SDKのアップデート④ 21 Strands Agents Evaluations • Strands Agentsのサブパッケージとして

    提供 • ビルトインとカスタムメトリクス両対応 • 使い分け ◦ ⼿軽に始めたい ▪ AgentCore Evals ◦ ⾃由度が欲しい ▪ Strands Agents Evaluations
  18. エッジデバイスで⾳声会話エージェント 22 Strands Agents 双⽅向ストリーミング • ユーザーとエージェントが同時に話せる ⾃然な会話 • 割り込みを⾃動検出‧処理(VAD)

    • 会話中にツール使⽤可能(並⾏実⾏) • エッジデバイスサポート ◦ llama.cppなどローカルモデル対応 ◦ ⼩規模デバイスでの⾳声AI実⾏
  19. まとめ 24 • RAG - ベクトル検索が速く‧安く‧簡単に ◦ Amazon OpenSearch Service:

    GPU 10倍⾼速化 + Auto-optimization ◦ Amazon S3 Vectors: 最⼤コスト90%削減、20億ベクトル ◦ Amazon Bedrock KnowledgeBase: マルチモーダル対応(画像/⾳声/動画) • AgentCore - 本番運⽤基盤が充実 ◦ 双⽅向ストリーミング、評価、ポリシー、記憶 • Strands Agents- OSSでより柔軟に ◦ TypeScript対応 ◦ SOP、Steering、評価、双⽅向ストリーミング