Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIエージェント入門

みのるん
February 28, 2025

 AIエージェント入門

最後に紹介しているハンズオン👇️
https://qiita.com/minorun365/items/85cb57f19fe16a87acff

みのるん

February 28, 2025
Tweet

More Decks by みのるん

Other Decks in Technology

Transcript

  1. 1 KDDI Agile Development Center Corporation ⾃⼰紹介 御⽥ 稔(みのるん) @minorun365

    テックエバンジェリスト KDDIアジャイル開発センター株式会社(KAG) クラウドや⽣成AIで内製開発を⾏いながら 技術の楽しさを広める活動をしています AWS Community Hero AWS Samurai 2023 2024 Japan AWS Top Engineer 2024 Japan AWS All Certs Engineer Qiita 2024 Top Contributor
  2. 3 KDDI Agile Development Center Corporation AIエージェントとは︖ エージェント = 代理⼈

    ◦ 誰の代理⼈︖ → あなた ➡ つまり、まるで⼈間のように働いてくれる賢いAIシステムのこと︕
  3. 4 KDDI Agile Development Center Corporation AIエージェントの起源 明確な定義はなく、似たような概念が昔から⾔葉を変えて提唱されている Franklin and

    Graesser (1997) “⾃律型エージェントとは、置かれた環境を認識 して、⾏動を起こし、計画を⽴てて未来に影響 を与えるシステムである”(意訳)
  4. 5 KDDI Agile Development Center Corporation LLM時代の「AIエージェント」の特徴 概ね以下の特徴をもつと⾔われている (Wang et

    al. 2024) AIエージェント プロファイリング ⻑期記憶 計画&振り返り ツール実⾏ 役割を定義したり パーソナライズできる ⼈間のように⻑い期間の 記憶をうまく保持する ⽬的を達成するために 計画を⽴て適宜修正する テキスト⽣成だけでなく 様々な外部ツールを使える
  5. 6 KDDI Agile Development Center Corporation LLM時代の「AIエージェント」の特徴 特にこの2つが重要︕ AIエージェント プロファイリング

    ⻑期記憶 計画&振り返り ツール実⾏ 役割を定義したり パーソナライズできる ⼈間のように⻑い期間の 記憶をうまく保持する ⽬的を達成するために 計画を⽴て適宜修正する テキスト⽣成だけでなく 様々な外部ツールを使える
  6. 8 KDDI Agile Development Center Corporation 特徴①「計画&振り返り」 単体のLLM AIエージェント ⽇本の⾸都は︖

    東京です オススメの旅⾏先は︖ 1回限りの推論(Inference)を実⾏ =次に続く確率が⾼い⾔葉を出⼒する • まずユーザーの好みを確認しよう • 返答に応じて、国内の主要観光地 を提案しよう • それでもダメなら海外の ⼈気観光地を提案しよう 過去気に⼊った観光地はありますか︖ 思考(Reasoning)して⾏動計画を⽴てる ※Chain of Thought(CoT)などの⼿法を利⽤
  7. 9 KDDI Agile Development Center Corporation 特徴①「計画&振り返り」 単体のLLM AIエージェント ⽇本の⾸都は︖

    東京です オススメの旅⾏先は︖ 1回限りの推論(Inference)を実⾏ =次に続く確率が⾼い⾔葉を出⼒する • まずユーザーの好みを確認しよう • 返答に応じて、国内の主要観光地 を提案しよう • それでもダメなら海外の ⼈気観光地を提案しよう 過去気に⼊った観光地はありますか︖ 思考(Reasoning)して⾏動計画を⽴てる ※Chain of Thought(CoT)などの⼿法を利⽤
  8. 10 KDDI Agile Development Center Corporation 特徴①「計画&振り返り」 単体のLLM AIエージェント ⽇本の⾸都は︖

    東京です いや〜、旅⾏初めてなんです 1回限りの推論(Inference)を実⾏ =次に続く確率が⾼い⾔葉を出⼒する • ユーザーに旅⾏経験がないようだ 別の⽅法で好みを確認しよう • その後、国内か海外の 主要観光地を提案しよう 国内か海外、どちらに興味がありますか︖ ⾏動結果を観察(Obsevation)して、 計画を修正することもできる
  9. 11 KDDI Agile Development Center Corporation いや〜、旅⾏初めてなんです 特徴①「計画&振り返り」 オススメの旅⾏先は︖ •

    まずユーザーの好みを確認しよう • 返答に応じて、国内の主要観光地 を提案しよう • それでもダメなら海外の ⼈気観光地を提案しよう 過去気に⼊った観光地はありますか︖ • ユーザーに旅⾏経験がないようだ 別の⽅法で好みを確認しよう • その後、国内か海外の 主要観光地を提案しよう 国内か海外、どちらに興味がありますか︖ Reasoning(思考) Acting(⾏動) Observation(観察) この「思考→⾏動→観察」を繰り返すアプローチを ReAct(Reasoning & Acting)と⾔います。 Yao et al. (2022)
  10. 12 KDDI Agile Development Center Corporation いや〜、旅⾏初めてなんです 特徴①「計画&振り返り」 オススメの旅⾏先は︖ •

    まずユーザーの好みを確認しよう • 返答に応じて、国内の主要観光地 を提案しよう • それでもダメなら海外の ⼈気観光地を提案しよう 過去気に⼊った観光地はありますか︖ • ユーザーに旅⾏経験がないようだ 別の⽅法で好みを確認しよう • その後、国内か海外の 主要観光地を提案しよう 国内か海外、どちらに興味がありますか︖ Reasoning(思考) Acting(⾏動) Observation(観察) この「思考→⾏動→観察」を繰り返すアプローチを ReAct(Reasoning & Acting)と⾔います。 Yao et al. (2022) つまり、LLMを 「テキスト⽣成機」ではなく 「思考エンジン」として 使うことができる︕
  11. 13 KDDI Agile Development Center Corporation 特徴②「ツール実⾏」 単体のLLM AIエージェント ⽇本の⾸都は︖

    東京です 学習済みの内容からテキストを⽣成するのみ ⽇本の⾸都は︖ 東京です 必要あれば、プログラムや外部APIなどの ツールを実⾏できる Web検索APIを実⾏ 「⽇本 ⾸都」
  12. 14 KDDI Agile Development Center Corporation 特徴②「ツール実⾏」 単体のLLM AIエージェント ⽇本の⾸都は︖

    東京です 学習済みの内容からテキストを⽣成するのみ ⽇本の⾸都は︖ 東京です 必要あれば、プログラムや外部APIなどの ツールを実⾏できる Web検索APIを実⾏ 「⽇本 ⾸都」
  13. 15 KDDI Agile Development Center Corporation 特徴②「ツール実⾏」 ⽇本の⾸都は︖ 東京です Web検索APIを実⾏

    「⽇本 ⾸都」 LLMにツールを使わせる機能を • Function Calling(関数呼び出し) • Tool Use(ツール利⽤) などと表現します。 ツールを使うか否かはLLMが判断し、 実⾏する際のパラメーター(検索クエリー等)も LLM⾃⾝が考えてくれるのが特徴です。
  14. 17 KDDI Agile Development Center Corporation 特徴②「ツール実⾏」 プログラムやAPIを実⾏できる。つまり、実質何でもできるすごい機能︕ Web検索 資料作成

    メール送信 社内システム の操作 つまり、LLMを 「テキスト⽣成機」ではなく 「ドラえもん」として 使うことができる︕
  15. 25 KDDI Agile Development Center Corporation ブームに幻滅させず、⽣成AIをビジネス成⻑に活かすには︖ • 今⾒てきたように、AIエージェントを活⽤すれば LLMの真価を最⼤限に活かしたプロダクトを開発できる

    • しかし、概念がやや難しいため、実際に投資を⾏うビジネスサイドの理解が追いつきづらい。 未だに「RAGかファインチューニングか」というLLM⽯器時代で⽌まっていることも多い。 このままだと⽣成AI⾃体が幻滅期に⼊り、テクノロジーの進化も失速してしまいかねない • ⽣成AIはDXと同様「システム発注者」の側が技術バズワードを指名して始まる案件が多い。 ITベンダーは、深い技術理解のもとクライアントの「真の要件」を探るスキルが必要となる (例︓その要件なら、RAGではなくAIエージェントでもっと簡単に実現できますよ︕)