Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「勝手に広まる」人気 AI エージェントを爆速で作ろう!(AWS Summit Japan 2...

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

「勝手に広まる」人気 AI エージェントを爆速で作ろう!(AWS Summit Japan 2026講演資料)

Avatar for みのるん

みのるん PRO

June 26, 2026

More Decks by みのるん

Other Decks in Technology

Transcript

  1. D E V 2 5 0 御⽥ 稔(AWS AI Hero)

    「勝⼿に広まる」 ⼈気 AI エージェントを爆速で作ろう︕ テックエバンジェリスト KDDIアジャイル開発センター株式会社
  2. • ⽤途が⼀般的(Web 検索、コ ーディングなど) • ⾃社データがメジャーな SaaS 上に揃っている • UI

    にこだわらない。とりあえ ずチャットできれば OK ⾃社で AI エージェントを「作る」必要あるの︖ 既製品で OK
  3. • ⽤途が⼀般的(Web 検索、コ ーディングなど) • ⾃社データがメジャーな SaaS 上に揃っている • UI

    にこだわらない。とりあえ ずチャットできれば OK ⾃社で AI エージェントを「作る」必要あるの︖ • ⾃社固有システムを操作させた り、SaaS にない業務データを参 照させたい • 既存システムにうまく AI 機能を 組み込みたい • ⾃社サービスとして UI 含めて作 り込みたい 既製品で OK ⾃前構築向き
  4. 通常の Web アプリと異なり、AI エージェントは癖がある • UX 向上のためにストリーミングレスポンスが重要 • ⾊んなツールを使うので、うまく認証認可を制御したい •

    会話履歴やパーソナライズを実装したい • PoC 案件が多いので、サーバーレスでコスト節約したい こういった要件を満たすには、 様々な AWS サービスを組み合わせる必要があった エージェントのコードは簡単に書けるが…
  5. アーキテクチャ AWS Cloud AWS Amplify Amazon Bedrock AgentCore ランタイム Amazon

    CloudWatch 生成 AI オブザーバビリティ Amazon Bedrock ナレッジベース Amazon Bedrock AgentCore メモリー Strands Agents セッション カタログ AWS What’s New RSS Tavily Search API ユーザー
  6. ⼯夫① シングルエージェント × ツール AWS Cloud AWS Amplify Amazon Bedrock

    AgentCore ランタイム Amazon CloudWatch 生成AIオブザーバビリティ Amazon Bedrock ナレッジベース Amazon Bedrock AgentCore メモリー Strands Agents セッション カタログ AWS What’s New RSS Tavily Search API ユーザー シンプルな実装で 多数の機能を 追加できる
  7. ⼯夫① シングルエージェント × ツール AWS Cloud AWS Amplify Amazon Bedrock

    AgentCore ランタイム Amazon CloudWatch 生成AIオブザーバビリティ Amazon Bedrock ナレッジベース Amazon Bedrock AgentCore メモリー Strands Agents セッション カタログ AWS What’s New RSS Tavily Search API ユーザー コミュニティ製 MCP サーバーを利⽤ Strands ビルトインの RSS ツールを流⽤ Strands ビルトインの Retrieve ツールを流⽤
  8. ⼯夫② モダン UI × サーバーレス AWS Cloud AWS Amplify Amazon

    Bedrock AgentCore ランタイム Amazon CloudWatch 生成AIオブザーバビリティ Amazon Bedrock ナレッジベース Amazon Bedrock AgentCore メモリー Strands Agents セッション カタログ AWS What’s New RSS Tavily Search API ユーザー Amplify Gen2 で React + Vite をホスト もちろん Cognito 認証付き︕
  9. ⼯夫③ RAG でドメイン知識を追加 AWS Cloud AWS Amplify Amazon Bedrock AgentCore

    ランタイム Amazon CloudWatch 生成AIオブザーバビリティ Amazon Bedrock ナレッジベース Amazon Bedrock AgentCore メモリー Strands Agents セッション カタログ AWS What’s New RSS Tavily Search API ユーザー Web で⾒つけにくい コミュニティの知⾒を S3 Vectors に格納
  10. ⼯夫③ RAG でドメイン知識を追加 Amazon Simple Storage Service (Amazon S3) Amazon

    Bedrock ナレッジベース Amazon S3 Vectors 事前に AI チャットボットに 調査・整理させた⼤量のデータを マークダウンで格納。 ベクトルデータは S3 Vectors で安価に運⽤
  11. ⼯夫④ リリース後が本番︕LLMOps を回す AWS Cloud AWS Amplify Amazon Bedrock AgentCore

    ランタイム Amazon CloudWatch 生成AIオブザーバビリティ Amazon Bedrock ナレッジベース Amazon Bedrock AgentCore メモリー Strands Agents セッション カタログ AWS What’s New RSS Tavily Search API ユーザー エージェントのトレースが ⾃動で集積、可視化される
  12. 私⾃⾝が Claude Code などのコーディングエージェントを活⽤し、 コーディング以外の⾃分の⽇常タスクをすべて半⾃動化。 • 経費精算、⼯数報告、勤務申請 • スライド作成、フォーム回答、会議アジェンダ検討 •

    海外旅⾏の⼿配、家計簿の管理、技術ミートアップの運営 ここで⾒つけた便利なユースケースを、 ⾮エンジニアでも享受できるよう Web アプリ化する ユースケース発掘② ⾃らモルモットに
  13. N E W パワポ作るマン G E N E R A

    L LY AVA I L A B L E 作りたい資料のトピックを簡単に伝えるだけで Web 検索を駆使して「AI っぽくない」綺麗なスライドを作成
  14. メイン機能 • Marp を⽤いたスライド作成 • Web 検索と URL 読み込み •

    はみ出し検知と⾃動修正 便利機能 • デザインテーマの切り替え • 成果物を PPTX/PDF で⼊⼿ • URL を発⾏して Web 公開 パワポ作るマン
  15. アーキテクチャ AWS Cloud AWS Amplify AgentCore ランタイム Amazon CloudWatch 生成AIオブザーバビリティ

    Strands Agents Marp スライド 作成/出⼒ Tavily Search API URL 読み込み ユーザー はみ出し 検知/修正
  16. • とにかく UX をシンプルにして、利⽤開始のハードルを下げた。 複雑なスライド編集機能などは載せず、 あえてチャット UI からの簡易修正に割り切り • ⻑期の履歴保持は不要のため、AgentCore

    メモリーは使わず AgentCore ランタイムのセッション流⽤で短期記憶を実現 • マルチエージェント構成も試⾏錯誤したが、 結局シングルエージェントの⽅が動作も品質も安定 実装の⼯夫
  17. • リリース後 3 ヶ⽉で 1,000 ユーザー突破 • 延べトレース数は 7,000 件に到達

    • 現在でも毎⽇利⽤されている ユースケースどハマり︕ ⼤⼈気アプリに
  18. • リリース後 3 ヶ⽉で 1,000 ユーザー突破 • 延べトレース数は 7,000 件に到達

    • 現在でも毎⽇利⽤されている • PoC アプリにありがちな「尻すぼみ」ではなく、 バズった後も継続的に使われ続けているのが特徴 • 私⾃⾝、海外ベンダーのテックブログを スマホからサクッと要約するのに毎週活⽤しています ユースケースどハマり︕ ⼤⼈気アプリに
  19. • LLM は「賢すぎないギリギリのモデル」を選択 (Claude Haiku だと荷が重い。Opus はやや過剰性能) • Claude のプロンプトキャッシュを有効化。

    また、システムプロンプトが⻑くなりすぎないよう ツールの description へ指⽰を分散 AI エージェントのコスト最適化
  20. • LLM は「賢すぎないギリギリのモデル」を選択 (Claude Haiku だと荷が重い。Opus はやや過剰性能) • Claude のプロンプトキャッシュを有効化。

    また、システムプロンプトが⻑くなりすぎないよう ツールの description へ指⽰を分散 • 会話ターンが嵩むと、コンテキストが膨らみトークン増に。 履歴は3往復のみ残す形で⾃動トリミングを実施 (Strands Agents の Conversation Manager を活⽤) AI エージェントのコスト最適化