Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrockでガードレールのフィルターを理解する
Search
Shota Totsuka
February 26, 2025
120
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Bedrockでガードレールのフィルターを理解する
Shota Totsuka
February 26, 2025
More Decks by Shota Totsuka
See All by Shota Totsuka
Figma to Codeから Code to Figmaへ
totsukash
0
1.7k
コードレビューはCLAUDE.md/skillsに書け。同じ指摘を繰り返すな。
totsukash
20
20k
HITL実装によるマルチエージェント組織の設計パターン
totsukash
1
110
Claude Codeの知らない知識に立ち向かう
totsukash
1
890
Claude Codeの知らない知識、ADK, A2Aを用いた プロダクト開発をClaude Codeで行う
totsukash
0
1.4k
Claude Code で Vibe Coding
totsukash
1
110
MCP, A2Aをプロダクトに組み込んで 開発している話
totsukash
1
59
Mastra活用|Text-to-SQLの実装と応用
totsukash
1
260
Bedrockでのプロンプト管理戦略
totsukash
3
230
Featured
See All Featured
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
610
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.4k
Designing for Timeless Needs
cassininazir
1
260
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
1
1.8k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
210
Are puppies a ranking factor?
jonoalderson
1
3.6k
Everyday Curiosity
cassininazir
0
240
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
370
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
400
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
220
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Transcript
None
自己紹介 ©Blueish 2024. All rights reserved. 戸塚 翔太|BLUEISH Shota Totsuka
・LLMアプリ開発者(Go/Python …etc) ・生成AI, 機械学習 ・趣味: スキー/スノボ, 最近はDifyにContribute ・静岡県(浜松)に住んでます 近くの方がいれば、一緒に勉強会しましょう! Xアカウント @totsukash
自己紹介 ©Blueish 2024. All rights reserved. AWS認定(1月から開始)
01 ガードレールとは? 02 料金・仕組み 03 フィルターの種類 04 デプロイ 目次 ©Blueish
2024. All rights reserved. 05 まとめ
01 ガードレールとは? ©Blueish 2024. All rights reserved.
©Blueish 2024. All rights reserved. ガードレールとは? - LLM Applicationにて、LLMへの入力やLLMからの出力の内容を保護する仕組み -
システム側が許容していない入力を弾く - システム側が許容していない出力をユーザーに返さない ガードレール
ガードレールとは? Amazon Bedrock Guardrails
ガードレールとは? 日本語の対応
02 料金・仕組み ©Blueish 2024. All rights reserved.
料金・仕組み 仕組み
仕組み・料金 料金
仕組み・料金 料金
03 フィルターの種類 ©Blueish 2024. All rights reserved.
フィルターの種類 コンテンツフィルター - Hate(ヘイト、憎悪) - Insults(侮辱) - Sexual(性的) - Violence(暴力)
- Misconduct(不正行為) - Prompt Attack(プロンプト攻撃) - ジェイルブレイク: 有害なコンテンツを生成させる - プロンプトインジェクション: プロンプトを上書きさせる
フィルターの種類
フィルターの種類
フィルターの種類 拒否されたトピック - 望ましくない拒否トピックを指定できる(最大30個) - 200文字でトピックの定義を説明 & 最大5つのサンプルフレーズ - 例
- 投資アドバイスに関する内容 - 仮想通貨に関する内容 - …etc
フィルターの種類
フィルターの種類 機密情報フィルター - 個人情報、機密情報をブロック / マスク できる - 住所,名前,email,クレジットカード,講座,IPアドレス …etc
- マスクの場合は [NAME-1], [EMAIL-1] などに置き換えられる - 正規表現での指定も可能
フィルターの種類
フィルターの種類
フィルターの種類 単語フィルター - 入力プロンプトやモデル応答内の単語やフレーズ (完全一致) をブロックする - 単語やフレーズ(最大3語)を10,000語まで指定可能 - S3に.txt/.csvをアップロードして登録することも可能
フィルターの種類
フィルターの種類 コンテキスト グラウンディングチェック - 参照ソースとユーザークエリが提供された場合に、モデル応答の幻覚を検出して フィルタリング - RAG, 要約など参考にすべきソースが入っている場合に使用 -
処理される各チャンクの関連性をチェック - 各モデル応答のグラウンディングと関連性に対応する信頼スコアが生成される - 閾値を用いてフィルタリング
フィルターの種類
フィルターの種類 画像コンテンツフィルター
04 デプロイ・検証 ©Blueish 2024. All rights reserved.
デプロイ・検証 デプロイ(バージョン管理)
デプロイ・検証 テスト
ご清聴ありがとうございました。 ©Blueish 2024. All rights reserved.