Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIエージェント時代のエンジニアになろう #jawsug #jawsdays2025 / 20...

AIエージェント時代のエンジニアになろう #jawsug #jawsdays2025 / 20250301 Agentic AI Engineering

2025.3.1 JAWS DAYS 2025で発表した資料です。
AIエージェント時代のエンジニアになろう:Agentic Workflows から環境に溶けこむAmbient Agents まで基礎と実践を50分で身につける

吉田真吾

March 01, 2025
Tweet

More Decks by 吉田真吾

Other Decks in Technology

Transcript

  1. 代表取締役CEO / Founder 西見 公宏 Masahiro Nishimi 事業会社の顧問CTOとして活動するソフトウェア開発のスペシャリスト。 AIエージェントを経営に導入することにより、あらゆる業種業態の生産 性を高めるための活動に尽力している。

    「その仕事、AIエージェントがやっておきました。――ChatGPTの次に来 る自律型AI革命」(技術評論社)単著、Software Design「実践LLMアプリ ケーション開発」(技術評論社)連載。 主な著書 『その仕事、AIエージェントがやっておきました』 取締役COO / Co-founder 吉田 真吾 Shingo Yoshida AWS Serverless Heroとして日本におけるサーバーレスの普及を促進。 「ChatGPT/LangChainによるチャットシステム構築[実践]入門」(技術 評論社)共著、「Azure OpenAI ServiceではじめるChatGPT/LLMシステム構 築入門」(技術評論社)共著、「AWSによるサーバーレスアーキテク チャ」(翔泳社)監修、「サーバーレスシングルページアプリケーショ ン」(オライリー)監訳、「AWSエキスパート養成読本」(技術評論 社)共著。ChatGPT Community(JP)主催 主な著書 『ChatGPT/LangChainによるチャットシステム構築[実践]入門』 『Azure OpenAI ServiceではじめるChatGPT/LLMシステム構築入門 エンジニア選書』 取締役CTO / Co-founder 大嶋 勇樹 Yuki Oshima 大規模言語モデルを組み込んだアプリケーションやAIエージェントの開 発を実施。 個人ではエンジニア向けの勉強会開催や教材作成など。オンラインコー スUdemyではベストセラー講座多数。 「ChatGPT/LangChainによるチャットシステム構築[実践]入門」(技術 評論社)共著。勉強会コミュニティStudyCo運営。 主な著書 『ChatGPT/LangChainによるチャットシステム構築 [実践]入門』 Generative Agents, Inc.
  2. 1990年代 2013 2018 2020 Word2Vec (NPLM), NLPS 静的な単語の関連性 ニューラル⾔語モデル 特定のNLPタスク⽤途

    タスク 解決 能⼒ ELMO, BERT, GPT-1/2 コンテキスト表現 事前学習+ファイン チューニング さまざまなNLPタスク ⽤途 GPT-3/4, ChatGPT, Claude ⾔語モデルの規模拡⼤ プロンプトによる⽳埋め さまざまな実世界のタスク ⽤途 A Survey of Large Language Models https://arxiv.org/abs/2303.18223 n-gram⾔語モデル 統計的⼿法 確率推定 特定のタスク⽤途 統計的⾔語モデル 特定タスク⽀援 ニューラル⾔語モデル タスクに依存しない 機能学習 事前学習済み⾔語 モデル 転移学習をもちいた NLPによるタスク解決 ⼤規模⾔語モデル (LLM) 汎⽤的なタスク解決
  3. Q "*ΤʔδΣϯτͱ͸ʁ " • ΤʔδΣϯτͱ͸ɺ環境を認識し、目標を達成 するために自律的に行動するଘࡏ • ΤʔδΣϯτΒ͠͞ͷ؍఺ ਓ޻஌ೳͷ֤෦෼ྖҬΛͦΕΒͷಠࣗͷྺ࢙తจ຺ ʹԊͬͯղઆ͢ΔͷͰ͸ͳ͘

    ݱࡏ஌ΒΕ͍ͯΔࣄฑ Λڞ௨ͷ࿮૊ΈͷதͰ࠶ߏங͢Δ͜ͱΛࢼΈͨ ˠཧ࿦ͱ࣮ફ ॳ൛೥ ๜༁೥ ୈ൛೥ ๜༁೥ ୈ൛ ೥ୈ൛೥
  4. ReAct: Synergizing Reasoning and Acting in Language Models (2022.10) •

    ݕূύλʔϯ B 3FBTPOͳ͠ɺ"DUͳ͠ C 3FBTPOͷΈ D "DUͷΈ E 3FBTPO͋Γɺ"DU͋Γ 3F"DU • ௐࠪλεΫ ˠ3F"DUͷΈਖ਼ղ • "MG8PSMEϕϯνϚʔΫ ˠ3F"DUͷΈਖ਼ղ https://arxiv.org/abs/2210.03629 Observe (観測) Reasoning (計画) Act (計画) ͘Γ͔͑͠ ˠ--.ͷ3FBTPOJOHੑೳͷ޲্ʹண໨ͨ͠ΤʔδΣϯτ΁ͷԠ༻
  5. メモリ 実⾏エージェント (GPT-4) (1) タスクと実⾏結果のペアを保存 (2) コンテキスト情報をメモリから読み出す 3. タスクの実⾏結果を送信する タスク作成エージェント

    (GPT-4) タスクキュー ユーザー 1. ⽬標やタスクを与える 2. タスクを実⾏させる コンテキスト情報 4 新しいタスクを追加 優先度づけエージェント (GPT-4) コンテキスト情報を メモリから読み出す コンテキスト情報 5. タスク優先度をつける 6. タスクを消す Task-driven Autonomous Agent https://yoheinakajima.com/task-driven-autonomous-agent-utilizing-gpt-4-pinecone-and-langchain-for-diverse-applications/ Baby AGI
  6. • ۀքɾۀछɾλεΫಛԽܕ • ཁٻɾཁ͕݅໌֬Ͱ͋Δ • ϫʔΫϑϩʔ͕ࣄલఆٛͰ͖Δ • ςετͰ͖ΔɾධՁͰ͖Δ バーティカル領域の AIエージェント

    ソフトウェア アーキテクチャ フレームワーク • ϓϩϯϓτνΣΠχϯά • --.λεΫɿϧʔςΟϯά੍ޚ΍ฒྻԽ • ϚϧνΤʔδΣϯτΦʔέετϨʔγϣϯ • ׬શࣗ཯ΤʔδΣϯτɿ؍ଌˠλεΫԽˠΞΫ γϣϯ • εςʔτϚγϯΛத৺ʹϫʔΫϑϩʔΛ؅ཧ͢Δ ΦʔέετϨʔλʔ • ίϯϙʔβϒϧͳ࣮ߦ؀ڥ !! ͢΂ͯͷ࢓ࣄ͸ϫʔΫϑϩʔͰ͋Δ
  7. 1. LLMアプリケーション開発の基礎 2. OpenAI APIの基礎 3. プロンプトエンジニアリング 4. LangChainの基礎 5.

    LCEL徹底解説 6. RAGアプリ開発実践 7. LangSmith 8. AIエージェントとは? 9. LangGraphでつくるAIエージェント実践入門 10.LangGraphでつくる要件定義生成AIエージェント 11.エージェントデザインパターン 12.LangChain/LangGraphで実装するエージェント デザインパターン 好評発売中
  8. Conditional Edge 実⾏待ち ノード Eメールの 新着チェック Eメール取得 ノード ノード Eメール

    クルー Eメール解析 フィルタリング 全スレッド取得 調査実施 下書き作成 crewAI + LangGraph https://github.com/crewAIInc/crewAI-examples/tree/main/CrewAI-LangGraph
  9. A1. 数学の問題を解く 学⽣ アシスタント 専⾨家 アシスタント 専 ⾨ 家 に

    聞 く 検索拡張 プロキシ 検索拡張 アシスタント A2. 検索拡張チャット ALFWorld 実⾏マシン A3. 意思決定 アシスタント グラウンディング エージェント 指揮官 A4. マルチエージェントコーディング ライター 護衛 マネージャー A5. 動的グループチャット ⼀⻫配信 会話 チェス盤 A6. 対話型チェス プレイヤー A プレイヤー B AutoGen
  10. 組織IQの向上 ビジネス ドメイン 技術理解 ケイパ 事業企画の高速化 合意形成 アイディエーションから事業企画化 まで短期間で実現をサポート ビジネス理解(ドメイン知識・現

    場ノウハウ)と技術理解の共通集 合を最大化するために、部署・職 種・役割を越境するためのトレー ニングを提供 生成AIサービスデザインの流れを 理解し、自社で売れる企画の推進 が可能に ˞(FOFSBUJWF"HFOUTࣾʮαʔϏεσβΠϯϫʔΫγϣοϓʯࢿྉ ੜ੒"*αʔϏεσβΠϯͷॏཁੑ
  11. "*ΛܦӦʹ׆͔͢ͱ͸ ۀ຿ʹಛԽͨ͠πʔϧ ٞࣄ࿥"* ೔ఔௐ੔ɾϝʔϧɾνϟοτ ΞΠσΟΤʔγϣϯ ௐࠪϨϙʔτ $3.4'"ΤʔδΣϯτ ιϑτ΢ΣΞ։ൃΤʔδΣϯτ ϓϩάϥϚʔ޲͚ ɾ$MJOF

    $VSTPS 8JOETVSG --. ɾ%FWJO 3FQMJU "HFOU ˠଞ࢈ۀͰ΋ࠓޙى͖͏Δઇ่తͳมԽ ྑ࣭ͳσʔληοτ͕஝ੵ͢Δ࢓૊Έ ۀछۀքͰͷΈ׆༻Ͱ͖Δඇެ։σʔλ ӡ༻͢Ε͹͢Δ΄Ͳ஝ੵ͞ΕΔ ސ٬Φʔμʔʗ"*ग़ྗʗਓؒʹΑͬͯ ΫΦϦςΟίϯτϩʔϧࡁͷਖ਼ղσʔλ σʔλϥΠϑαΠΫϧɾอ؅΍׆༻ͷنఔ "*ΦϯϘʔσΟϯάͷϊ΢ϋ΢ IUUQTOPUFDPNOSSZVZBOODCBDF ྑ࣭ͳ$P5ϊ΢ϋ΢ %FFQ3FTFBSDI͕ূ໌ "*Λ࢖͏ "*ͰՔ͙ バーティカル領域のAIエージェント ۀछʹಛԽͨ͠ιϦϡʔγϣϯ MOAT 労働⽣産性の向上 ソフトウェア開発の歴史的転換点
  12. ੒ޭ͸ՊֶͰ͖Δ パフォーマンスが成功を促す。 パフォーマンスが測定できない 時には、ネットワークが成功を 促す 01. ύϑΥʔϚϯεʹ͸্ݶ͕͋Δ͕ɺ ੒ޭʹ͸্ݶ͕ͳ͍ 02. աڈͷ੒ޭ

    YదԠ౓ কདྷͷ੒ޭ 03. νʔϜͷ੒ޭʹ͸ όϥϯεͱଟ༷ੑ ͕ෆՄ͕ܽͩɺޭ ੷ΛೝΊΒΕΔͷ ͸ͻͱΓ͚ͩ 04. ෆ۶ͷਫ਼ਆ͕͋Ε͹ɺ ੒ޭ͸͍ͭͰ΋΍ͬ ͯ͘Δ 05. βɾϑΥʔϛϡϥ Պֶ͕ղ͖໌͔ͨ͠ʮ੒ޭͷීวత๏ଇʯ IUUQTCPPLTLPCVOTIBDPNCPPLCIUNM ྑ͍ίϛϡχςΟ΍ωοτϫʔΫʹ਎Λஔ͍ͯ ݚᮎɾߩݙˠ੒ޭ
  13. ΤΠνɾπʔɾΦʔϦςΠϦϯάגࣜձ༷ࣾ Ϋϥ΢υγϑτ ✅"84ʹΑΔॊೈͳΠϯϑ ϥج൫ͷ࣮ݱ ✅಺੡։ൃ૊৫ͷମ੍ڧԽ %FW0QTόΠϞʔμϧઓུ ✅ ϚϧνΞΧ΢ϯτ؅ཧ "840SHBOJ[BUJPOT$POUSPM5PXFS ✅

    ΨόφϯεڧԽ 4$1ʹΑΔ౷߹؅ཧ ✅*OGSBTUSVDUVSFBT$PEF 5FSSBGPSNͰ"84ΞΧ΢ϯτˍ440؅ཧ ✅$*$%ύΠϓϥΠϯ੔උ (JU)VC׆༻ʹΑΔϦϦʔε؅ཧͷ࠷దԽ ϦΞϧͱσδλϧΛ༥߹ͨ͠ʮίϛϡχέʔγϣϯϦςΠϥʔʯͷ࣮ݱ AWS モダナイゼーション クラウド活⽤によるDX 2021〜 2024〜
  14. $PHOJUP "84-BNCEB  (PPHMF"QQ &OHJOF 1SFWJFX 8IZ5IF'VUVSF0G4PGUXBSF "OE"QQT*T4FSWFSMFTT ϑϩϯτΤϯυͷओઓ৔Խʹ ൐͏όοΫΤϯυͷύʔπԽ

     "NB[PO4   "1*(BUFXBZ ,JOFTJT'JSFIPTF   $MPVE8BUDI&WFOUT &WFOU#SJEHF 4UFQ'VODUJPOT "UIFOB (MVF  "VSPSB4FSWFSMFTT7 "QQ'MPX 1SPUPO  "QQMJDBUJPO $PNQPTFS 0QFO4FBSDI 4FSWFSMFTT  #FESPDL "QQ'BCSJD ##%BUB*OUFSDIBOHF &MBTUJ$BDIF 4FSWFSMFTT  "QQ4ZOD "84'BSHBUF 4FSWFSMFTT"QQMJDBUJPO3FQPTJUPSZ lͪΐͬͱzαʔόʔϨε΋ αʔόʔϨε ΠϕϯτϧʔςΟϯάɺϑΣσϨʔ γϣϯɺεςʔτϚγϯͳͲͷਐԽ $%/ΤοδͷαʔόʔϨε 7 8BTN CZ4IJOHP٢ాਅޗ !"844FSWFSMFTT)FSP <ࢀߟࢿྉ> 'JHIUJOHPGGGBVYTFSWFSMFTTCBOEJUTXJUIUIFUSVFEFGJOJUJPOPGTFSWFSMFTT IUUQTXXXHPNPNFOUPDPNCMPHGJHIUJOHPGGGBLFTFSWFSMFTTCBOEJUTXJUIUIFUSVFEFGJOJUJPOPGTFSWFSMFTT Ί΋͓͖͹5FDI3FQPSU ʮαʔόʔϨεͷ࣍͸ͳΜͳΜͩʯ IUUQTOFLPSVSJCPPUIQNJUFNT
  15. • 最優先 = Product Market Fit • ビジネスコード開発に時間を使う • 顧客とのイテレーションを最⼤化する

    • Commercial Search • 2⼈の開発者 x 4ヶ⽉ • TypeScript 13,307⾏ • 開発者の稼働 95%以上 • Microservices的だが⾃分たちはコアだけ • 依存性の最⼩化:仕様確定待ち、DBA待ち などを避ける IUUQXXXTMJEFTIBSFOFU4FSWFSMFTT$POGKPFFNJTPOYQSPEVDUEFWFMPQNFOU αʔόʔϨε͸։ൃΛՃ଎͢Δ
  16. "NCJFOU"HFOUT • ؀ڥ಺ͰΤʔδΣϯτ͕ৗ࣌׆ಈ͢Δ ύϥμΠϜ • ΠϕϯτυϦϒϯͰෳ਺ɾฒྻ࣮ߦ • -BOH(SBQIͰߏஙՄೳ ӬଓϨΠϠʔ )VNBOJOUIFMPPQ

    ௕ظϝϞϦ $SPOδϣϒ "HFOU*OCPY ࢀর࣮૷ • ࣮ߦதͷ--.λεΫͷҰཡԽ IUUQTCMPHMBOHDIBJOEFWJOUSPEVDJOHBNCJFOUBHFOUT ੬ऑੑʹର͢Δ߈ܸ΍ෆద੾ͳߦಈͷ؂ࢹ PZˠαʔΩοτϒϨʔΧʔ΍ਓؒͷհೖ ߈ܸίετ ๷Ӵίετ *OUSPEVDJOHBNCJFOUBHFOUT ՝୊