Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock で検索エージェントを再現しようとした話
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Naoki Yoshitake
September 17, 2025
Technology
3
510
Bedrock で検索エージェントを再現しようとした話
2025.09.17 JAWS-UG AI/ML #31:Generative AI / ML LT大会
Naoki Yoshitake
September 17, 2025
Tweet
Share
More Decks by Naoki Yoshitake
See All by Naoki Yoshitake
TechPM ってどんな仕事?
ny7760
0
160
開発者から見たLLMの進化 202511
ny7760
1
250
開発者から見たLLMの進化
ny7760
2
87
re:Invent 2024 Keynoteに対する所感と考察 | My Take on the Keynote
ny7760
0
120
来年もre:Invent2024 に行きたいあなたへ - “集中”と“つながり”で楽しむ -
ny7760
1
1.2k
ロングコンテキストLLMにリポジトリを読み込ませてみる
ny7760
0
930
The Twelve-Factor App とクラウドアプリケーションのコスト
ny7760
4
740
re:Invent期間に発表されたCloudWatch Logsのアップデートを金融エンジニアの目線で試してみる
ny7760
1
1.1k
Other Decks in Technology
See All in Technology
Amazon Bedrock Knowledge Basesチャンキング解説!
aoinoguchi
0
130
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1.3k
Tebiki Engineering Team Deck
tebiki
0
24k
小さく始めるBCP ― 多プロダクト環境で始める最初の一歩
kekke_n
1
390
ブロックテーマ、WordPress でウェブサイトをつくるということ / 2026.02.07 Gifu WordPress Meetup
torounit
0
170
茨城の思い出を振り返る ~CDKのセキュリティを添えて~ / 20260201 Mitsutoshi Matsuo
shift_evolve
PRO
1
240
データの整合性を保ちたいだけなんだ
shoheimitani
8
3.1k
20260204_Midosuji_Tech
takuyay0ne
1
150
IaaS/SaaS管理における SREの実践 - SRE Kaigi 2026
bbqallstars
4
2k
超初心者からでも大丈夫!オープンソース半導体の楽しみ方〜今こそ!オレオレチップをつくろう〜
keropiyo
0
110
データ民主化のための LLM 活用状況と課題紹介(IVRy の場合)
wxyzzz
2
700
AIと新時代を切り拓く。これからのSREとメルカリIBISの挑戦
0gm
0
880
Featured
See All Featured
Marketing to machines
jonoalderson
1
4.6k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
210
Designing for Performance
lara
610
70k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Bash Introduction
62gerente
615
210k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Color Theory Basics | Prateek | Gurzu
gurzu
0
200
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.6k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
64
Transcript
CONF ID ENTIA L 1 © 2025 Japan Digital Design,
Inc. Bedrock で検索エージェントを 再現しようとした話 Naoki Yoshitake 2025.09.17
2 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自己紹介 •
2023/11 JDD 入社 • Technical Project Manager • Bedrockを使ったRAGアプリの開発・運用 プロフィール • 2022 APN AWS Top Engineer • 『AWS認定資格試験テキスト AWS認定SysOpsアドミニスト レーター – アソシエイト』 • 『AWS vs Google Cloud アプリ開発七番勝負』 ※同人誌 出版等 Naoki Yoshitake 左後ろです
3 CONFIDENTIAL © 2024 Japan Digital Design, Inc. Japan Digital
Design株式会社 2017年10月2日 代表取締役 CEO 浜根 吉男 85名(2023年9月末時点) 株式会社三菱UFJフィナンシャル・グループ 株式会社三菱総合研究所 三菱UFJリサーチ&コンサルティング株式会社 社名 設立 代表者 従業員数 株主構成 会社概要
4 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫Agentic Workflow?
⚫自律型エージェント? 人によってイメージするものはさまざま 検索エージェントとは? 検索エージェントとは
5 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫個人的には ChatGPT
の GPT-5 Thinking(o3)が とても使える検索エージェント ⚫Bedrockでもこんなアプリを再現してみたいなあ… このLTではGPT-5 Thinkingをイメージ 検索エージェントとは
6 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/
7 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/ OpenAIの検索エージェントの仕組みを学びながら Bedrockで同じようなことをやるには?と考えてみる
8 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 検索エージェント ⚫そのままAPIコールしてもChatGPTと
同じ動きにはならない ⚫ChatGPTとAPIでは挙動が異なる。 ⚫ このLTでは3つの挙動を再現してみる ⚫ 自律的に『思考』する ⚫ ツールを活用する ⚫ 推論プロセスが可視化される 『検索エージェント』の再現 ChatGPT からGPT-5 Thinkingを利用した画面
9 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自律的に推論する ⚫
推論モデルはReasoning Token(推論 トークン)を使い『思考』する ⚫ APIでは思考の「深さ」をパラメータ で指定できる 自律的に『思考』する 推論で利用するパラメータ パラメータ 概要 reasoning.effort 推論の深さ。デフォルトはmedium。highを指定 するとより深く推論する reasoning.summary モデルが実行した推論プロセスの要約を出力する
10 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
ChatGPT上ではモデルが使えるツー ルが Built-in で提供されている ⚫ モデルは問題を解くために思考して、 自律的にツールを使うか判断する ⚫ LLMが苦手な問題に対応できる ⚫ 学習範囲外の知識を利用 ⚫ 計算問題をコードで解く 等 ツールを活用する GPTで使えるツール例 ツール例 概要 効果 Web Search インターネット検索の結果を 生成に利用できる 学習範囲外の情報をコンテキ ストに含められる File Search アップロードされたファイル 内を検索できる ファイル内の情報をコンテキ ストに含められる Code Interpreter 隔離された環境でモデルが コードを実行できる 計算問題など、LLMが苦手な 処理をコードで計算して回答 できる
11 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
実行環境により3種類のツール ⚫ Built-in tools ⚫ MCP Tools ⚫ Function calls(Function calling) ⚫ モデルが自律的にツールを使うには、 Built-in tools か MCP Tools ⚫ Function calling ではクライアント側で明 示的に呼び出し処理が必要 ツールの様々な実行環境 ツール実行環境のイメージ クライアント LLMモデル リモートMCP Built-in tools MCP Tools Function calls OpenAI のサーバー サードパーティ等
12 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 推論プロセスが可視化される ⚫
SSE(Server-Sent Events)で様々な イベントが送られる ⚫ クライアント側でイベントをハンドリン グすれば、推論処理を可視化できる ⚫ エージェントのブラックボックス化防止 ⚫ ユーザーのUX向上 Stream応答ではイベントが発行 イベント例 イベントの発行タイミング reasoning_summary_text.done 推論の要約テキストの生成が完了した時 output_text.done モデルのテキスト回答が確定した時 completed モデルの応答が完了した時 GPTのイベント例 サンプルコード(carbon)
13 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
14 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
同じことがBedrockのgpt-ossでもできたら 検索エージェントが作れるのでは…!
15 CONFIDENTIAL © 2025 Japan Digital Design, Inc. できませんでした
16 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock で gpt-oss を使う方法 ⚫ Bedrock API(Converse API 等) ⚫ OpenAI SDK ⚫ OpenAI の Responses AI は未対応 ⚫ 対応はChat Completions APIのみ ⚫ gpt-oss × Bedrock API (Converse API) で検証する必要あり ⚫ 統一的なAPIで呼び出す思想のため? ⚫ 個人的にはResponses APIにも対応して欲しい… Bedrockのgpt-ossは Responses API 未対応 https://docs.aws.amazon.com/bedrock/latest/userguide/inference-chat-completions.html Chat Completions APIの記載はある がResponses APIは無い
17 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html
18 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html モデルに互換性があるからと言って安易に考えず Bedrockの考え方を理解する必要あり
19 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫便利な検索エージェントの仕組みを知ろう ⚫OpenAI,
Bedrock(+Anthropic )のAPI違いを知ると勉強になる ⚫Bedrock で gpt-oss 使うにはハードルあり ⚫次はBedrock × Claude で実装してみたい まとめ まとめ ※本日の内容は個人の見解に基づくものであり、所属企業を代表するものではありません。
20 CONFIDENTIAL © 2025 Japan Digital Design, Inc. おわりに ⚫本日の内容のほとんどは→の記事にも
書いています。 ⚫こちらも読んでみてください。 Qiitaやってます https://qiita.com/ny7760/items/ae4143b40cc1d594855b
Thank you. 21 CONFIDENTIAL © 2025 Japan Digital Design, Inc.