Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock で検索エージェントを再現しようとした話
Search
Naoki Yoshitake
September 17, 2025
Technology
3
350
Bedrock で検索エージェントを再現しようとした話
2025.09.17 JAWS-UG AI/ML #31:Generative AI / ML LT大会
Naoki Yoshitake
September 17, 2025
Tweet
Share
More Decks by Naoki Yoshitake
See All by Naoki Yoshitake
開発者から見たLLMの進化
ny7760
2
56
re:Invent 2024 Keynoteに対する所感と考察 | My Take on the Keynote
ny7760
0
110
来年もre:Invent2024 に行きたいあなたへ - “集中”と“つながり”で楽しむ -
ny7760
1
1.2k
ロングコンテキストLLMにリポジトリを読み込ませてみる
ny7760
0
860
The Twelve-Factor App とクラウドアプリケーションのコスト
ny7760
4
680
re:Invent期間に発表されたCloudWatch Logsのアップデートを金融エンジニアの目線で試してみる
ny7760
1
1k
Other Decks in Technology
See All in Technology
20251007: What happens when multi-agent systems become larger? (CyberAgent, Inc)
ornew
1
240
いまからでも遅くない!SSL/TLS証明書超入門(It's not too late to start! SSL/TLS Certificates: The Absolute Beginner's Guide)
norimuraz
0
190
綺麗なデータマートをつくろう_データ整備を前向きに考える会 / Let's create clean data mart
brainpadpr
3
430
セキュアな認可付きリモートMCPサーバーをAWSマネージドサービスでつくろう! / Let's build an OAuth protected remote MCP server based on AWS managed services
kaminashi
3
310
OCI Network Firewall 概要
oracle4engineer
PRO
2
7.9k
Vibe Coding Year in Review. From Karpathy to Real-World Agents by Niels Rolland, CEO Paatch
vcoisne
0
130
Developer Advocate / Community Managerなるには?
tsho
0
140
Escaping_the_Kraken_-_October_2025.pdf
mdalmijn
0
170
LLM時代にデータエンジニアの役割はどう変わるか?
ikkimiyazaki
6
1.3k
[Keynote] What do you need to know about DevEx in 2025
salaboy
0
160
これがLambdaレス時代のChatOpsだ!実例で学ぶAmazon Q Developerカスタムアクション活用法
iwamot
PRO
6
1k
『バイトル』CTOが語る! AIネイティブ世代と切り拓くモノづくり組織
dip_tech
PRO
1
120
Featured
See All Featured
Become a Pro
speakerdeck
PRO
29
5.5k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Git: the NoSQL Database
bkeepers
PRO
431
66k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.6k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
YesSQL, Process and Tooling at Scale
rocio
173
14k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
GitHub's CSS Performance
jonrohan
1032
470k
The Cult of Friendly URLs
andyhume
79
6.6k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
Transcript
CONF ID ENTIA L 1 © 2025 Japan Digital Design,
Inc. Bedrock で検索エージェントを 再現しようとした話 Naoki Yoshitake 2025.09.17
2 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自己紹介 •
2023/11 JDD 入社 • Technical Project Manager • Bedrockを使ったRAGアプリの開発・運用 プロフィール • 2022 APN AWS Top Engineer • 『AWS認定資格試験テキスト AWS認定SysOpsアドミニスト レーター – アソシエイト』 • 『AWS vs Google Cloud アプリ開発七番勝負』 ※同人誌 出版等 Naoki Yoshitake 左後ろです
3 CONFIDENTIAL © 2024 Japan Digital Design, Inc. Japan Digital
Design株式会社 2017年10月2日 代表取締役 CEO 浜根 吉男 85名(2023年9月末時点) 株式会社三菱UFJフィナンシャル・グループ 株式会社三菱総合研究所 三菱UFJリサーチ&コンサルティング株式会社 社名 設立 代表者 従業員数 株主構成 会社概要
4 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫Agentic Workflow?
⚫自律型エージェント? 人によってイメージするものはさまざま 検索エージェントとは? 検索エージェントとは
5 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫個人的には ChatGPT
の GPT-5 Thinking(o3)が とても使える検索エージェント ⚫Bedrockでもこんなアプリを再現してみたいなあ… このLTではGPT-5 Thinkingをイメージ 検索エージェントとは
6 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/
7 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/ OpenAIの検索エージェントの仕組みを学びながら Bedrockで同じようなことをやるには?と考えてみる
8 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 検索エージェント ⚫そのままAPIコールしてもChatGPTと
同じ動きにはならない ⚫ChatGPTとAPIでは挙動が異なる。 ⚫ このLTでは3つの挙動を再現してみる ⚫ 自律的に『思考』する ⚫ ツールを活用する ⚫ 推論プロセスが可視化される 『検索エージェント』の再現 ChatGPT からGPT-5 Thinkingを利用した画面
9 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自律的に推論する ⚫
推論モデルはReasoning Token(推論 トークン)を使い『思考』する ⚫ APIでは思考の「深さ」をパラメータ で指定できる 自律的に『思考』する 推論で利用するパラメータ パラメータ 概要 reasoning.effort 推論の深さ。デフォルトはmedium。highを指定 するとより深く推論する reasoning.summary モデルが実行した推論プロセスの要約を出力する
10 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
ChatGPT上ではモデルが使えるツー ルが Built-in で提供されている ⚫ モデルは問題を解くために思考して、 自律的にツールを使うか判断する ⚫ LLMが苦手な問題に対応できる ⚫ 学習範囲外の知識を利用 ⚫ 計算問題をコードで解く 等 ツールを活用する GPTで使えるツール例 ツール例 概要 効果 Web Search インターネット検索の結果を 生成に利用できる 学習範囲外の情報をコンテキ ストに含められる File Search アップロードされたファイル 内を検索できる ファイル内の情報をコンテキ ストに含められる Code Interpreter 隔離された環境でモデルが コードを実行できる 計算問題など、LLMが苦手な 処理をコードで計算して回答 できる
11 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
実行環境により3種類のツール ⚫ Built-in tools ⚫ MCP Tools ⚫ Function calls(Function calling) ⚫ モデルが自律的にツールを使うには、 Built-in tools か MCP Tools ⚫ Function calling ではクライアント側で明 示的に呼び出し処理が必要 ツールの様々な実行環境 ツール実行環境のイメージ クライアント LLMモデル リモートMCP Built-in tools MCP Tools Function calls OpenAI のサーバー サードパーティ等
12 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 推論プロセスが可視化される ⚫
SSE(Server-Sent Events)で様々な イベントが送られる ⚫ クライアント側でイベントをハンドリン グすれば、推論処理を可視化できる ⚫ エージェントのブラックボックス化防止 ⚫ ユーザーのUX向上 Stream応答ではイベントが発行 イベント例 イベントの発行タイミング reasoning_summary_text.done 推論の要約テキストの生成が完了した時 output_text.done モデルのテキスト回答が確定した時 completed モデルの応答が完了した時 GPTのイベント例 サンプルコード(carbon)
13 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
14 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
同じことがBedrockのgpt-ossでもできたら 検索エージェントが作れるのでは…!
15 CONFIDENTIAL © 2025 Japan Digital Design, Inc. できませんでした
16 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock で gpt-oss を使う方法 ⚫ Bedrock API(Converse API 等) ⚫ OpenAI SDK ⚫ OpenAI の Responses AI は未対応 ⚫ 対応はChat Completions APIのみ ⚫ gpt-oss × Bedrock API (Converse API) で検証する必要あり ⚫ 統一的なAPIで呼び出す思想のため? ⚫ 個人的にはResponses APIにも対応して欲しい… Bedrockのgpt-ossは Responses API 未対応 https://docs.aws.amazon.com/bedrock/latest/userguide/inference-chat-completions.html Chat Completions APIの記載はある がResponses APIは無い
17 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html
18 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html モデルに互換性があるからと言って安易に考えず Bedrockの考え方を理解する必要あり
19 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫便利な検索エージェントの仕組みを知ろう ⚫OpenAI,
Bedrock(+Anthropic )のAPI違いを知ると勉強になる ⚫Bedrock で gpt-oss 使うにはハードルあり ⚫次はBedrock × Claude で実装してみたい まとめ まとめ ※本日の内容は個人の見解に基づくものであり、所属企業を代表するものではありません。
20 CONFIDENTIAL © 2025 Japan Digital Design, Inc. おわりに ⚫本日の内容のほとんどは→の記事にも
書いています。 ⚫こちらも読んでみてください。 Qiitaやってます https://qiita.com/ny7760/items/ae4143b40cc1d594855b
Thank you. 21 CONFIDENTIAL © 2025 Japan Digital Design, Inc.