Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock で検索エージェントを再現しようとした話
Search
Naoki Yoshitake
September 17, 2025
Technology
3
400
Bedrock で検索エージェントを再現しようとした話
2025.09.17 JAWS-UG AI/ML #31:Generative AI / ML LT大会
Naoki Yoshitake
September 17, 2025
Tweet
Share
More Decks by Naoki Yoshitake
See All by Naoki Yoshitake
開発者から見たLLMの進化 202511
ny7760
1
190
開発者から見たLLMの進化
ny7760
2
82
re:Invent 2024 Keynoteに対する所感と考察 | My Take on the Keynote
ny7760
0
120
来年もre:Invent2024 に行きたいあなたへ - “集中”と“つながり”で楽しむ -
ny7760
1
1.2k
ロングコンテキストLLMにリポジトリを読み込ませてみる
ny7760
0
900
The Twelve-Factor App とクラウドアプリケーションのコスト
ny7760
4
700
re:Invent期間に発表されたCloudWatch Logsのアップデートを金融エンジニアの目線で試してみる
ny7760
1
1k
Other Decks in Technology
See All in Technology
レガシーシステム刷新における TypeSpec スキーマ駆動開発のすゝめ
tsukuha
4
880
AI開発の定着を推進するために揃えるべき前提
suguruooki
1
450
type-challenges を全問解いたのでエッセンスと推し問題を紹介してみる
kworkdev
PRO
0
140
確実に伝えるHealth通知 〜半自動システムでほどよく漏れなく / JAWS-UG 神戸 #9 神戸へようこそ!LT会
genda
0
160
その意思決定、まだ続けるんですか? ~痛みを超えて未来を作る、AI時代の撤退とピボットの技術~
applism118
45
25k
ページの可視領域を算出する方法について整理する
yamatai1212
0
140
Active Directory 勉強会 第 6 回目 Active Directory セキュリティについて学ぶ回
eurekaberry
14
4.9k
Digital omtanke på Internetdagarna 2025
axbom
PRO
0
150
機械学習を「社会実装」するということ 2025年冬版 / Social Implementation of Machine Learning November 2025 Version
moepy_stats
4
1.2k
Capture Checking / Separation Checking 入門
tanishiking
0
110
Modern Data Stack大好きマンが語るSnowflakeの魅力
sagara
0
170
生成AIシステムとAIエージェントに関する性能や安全性の評価
shibuiwilliam
2
280
Featured
See All Featured
The Cult of Friendly URLs
andyhume
79
6.7k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
990
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
118
20k
Six Lessons from altMBA
skipperchong
29
4.1k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Making Projects Easy
brettharned
120
6.5k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
68k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.1k
Transcript
CONF ID ENTIA L 1 © 2025 Japan Digital Design,
Inc. Bedrock で検索エージェントを 再現しようとした話 Naoki Yoshitake 2025.09.17
2 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自己紹介 •
2023/11 JDD 入社 • Technical Project Manager • Bedrockを使ったRAGアプリの開発・運用 プロフィール • 2022 APN AWS Top Engineer • 『AWS認定資格試験テキスト AWS認定SysOpsアドミニスト レーター – アソシエイト』 • 『AWS vs Google Cloud アプリ開発七番勝負』 ※同人誌 出版等 Naoki Yoshitake 左後ろです
3 CONFIDENTIAL © 2024 Japan Digital Design, Inc. Japan Digital
Design株式会社 2017年10月2日 代表取締役 CEO 浜根 吉男 85名(2023年9月末時点) 株式会社三菱UFJフィナンシャル・グループ 株式会社三菱総合研究所 三菱UFJリサーチ&コンサルティング株式会社 社名 設立 代表者 従業員数 株主構成 会社概要
4 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫Agentic Workflow?
⚫自律型エージェント? 人によってイメージするものはさまざま 検索エージェントとは? 検索エージェントとは
5 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫個人的には ChatGPT
の GPT-5 Thinking(o3)が とても使える検索エージェント ⚫Bedrockでもこんなアプリを再現してみたいなあ… このLTではGPT-5 Thinkingをイメージ 検索エージェントとは
6 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/
7 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/ OpenAIの検索エージェントの仕組みを学びながら Bedrockで同じようなことをやるには?と考えてみる
8 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 検索エージェント ⚫そのままAPIコールしてもChatGPTと
同じ動きにはならない ⚫ChatGPTとAPIでは挙動が異なる。 ⚫ このLTでは3つの挙動を再現してみる ⚫ 自律的に『思考』する ⚫ ツールを活用する ⚫ 推論プロセスが可視化される 『検索エージェント』の再現 ChatGPT からGPT-5 Thinkingを利用した画面
9 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自律的に推論する ⚫
推論モデルはReasoning Token(推論 トークン)を使い『思考』する ⚫ APIでは思考の「深さ」をパラメータ で指定できる 自律的に『思考』する 推論で利用するパラメータ パラメータ 概要 reasoning.effort 推論の深さ。デフォルトはmedium。highを指定 するとより深く推論する reasoning.summary モデルが実行した推論プロセスの要約を出力する
10 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
ChatGPT上ではモデルが使えるツー ルが Built-in で提供されている ⚫ モデルは問題を解くために思考して、 自律的にツールを使うか判断する ⚫ LLMが苦手な問題に対応できる ⚫ 学習範囲外の知識を利用 ⚫ 計算問題をコードで解く 等 ツールを活用する GPTで使えるツール例 ツール例 概要 効果 Web Search インターネット検索の結果を 生成に利用できる 学習範囲外の情報をコンテキ ストに含められる File Search アップロードされたファイル 内を検索できる ファイル内の情報をコンテキ ストに含められる Code Interpreter 隔離された環境でモデルが コードを実行できる 計算問題など、LLMが苦手な 処理をコードで計算して回答 できる
11 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
実行環境により3種類のツール ⚫ Built-in tools ⚫ MCP Tools ⚫ Function calls(Function calling) ⚫ モデルが自律的にツールを使うには、 Built-in tools か MCP Tools ⚫ Function calling ではクライアント側で明 示的に呼び出し処理が必要 ツールの様々な実行環境 ツール実行環境のイメージ クライアント LLMモデル リモートMCP Built-in tools MCP Tools Function calls OpenAI のサーバー サードパーティ等
12 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 推論プロセスが可視化される ⚫
SSE(Server-Sent Events)で様々な イベントが送られる ⚫ クライアント側でイベントをハンドリン グすれば、推論処理を可視化できる ⚫ エージェントのブラックボックス化防止 ⚫ ユーザーのUX向上 Stream応答ではイベントが発行 イベント例 イベントの発行タイミング reasoning_summary_text.done 推論の要約テキストの生成が完了した時 output_text.done モデルのテキスト回答が確定した時 completed モデルの応答が完了した時 GPTのイベント例 サンプルコード(carbon)
13 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
14 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
同じことがBedrockのgpt-ossでもできたら 検索エージェントが作れるのでは…!
15 CONFIDENTIAL © 2025 Japan Digital Design, Inc. できませんでした
16 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock で gpt-oss を使う方法 ⚫ Bedrock API(Converse API 等) ⚫ OpenAI SDK ⚫ OpenAI の Responses AI は未対応 ⚫ 対応はChat Completions APIのみ ⚫ gpt-oss × Bedrock API (Converse API) で検証する必要あり ⚫ 統一的なAPIで呼び出す思想のため? ⚫ 個人的にはResponses APIにも対応して欲しい… Bedrockのgpt-ossは Responses API 未対応 https://docs.aws.amazon.com/bedrock/latest/userguide/inference-chat-completions.html Chat Completions APIの記載はある がResponses APIは無い
17 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html
18 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html モデルに互換性があるからと言って安易に考えず Bedrockの考え方を理解する必要あり
19 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫便利な検索エージェントの仕組みを知ろう ⚫OpenAI,
Bedrock(+Anthropic )のAPI違いを知ると勉強になる ⚫Bedrock で gpt-oss 使うにはハードルあり ⚫次はBedrock × Claude で実装してみたい まとめ まとめ ※本日の内容は個人の見解に基づくものであり、所属企業を代表するものではありません。
20 CONFIDENTIAL © 2025 Japan Digital Design, Inc. おわりに ⚫本日の内容のほとんどは→の記事にも
書いています。 ⚫こちらも読んでみてください。 Qiitaやってます https://qiita.com/ny7760/items/ae4143b40cc1d594855b
Thank you. 21 CONFIDENTIAL © 2025 Japan Digital Design, Inc.