Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[OpsJAWS Meetup33 AIOps] Amazon Bedrockガードレール...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
為藤アキラ
March 04, 2025
Technology
380
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
[OpsJAWS Meetup33 AIOps] Amazon Bedrockガードレールで守る安全なAI運用
為藤アキラ
March 04, 2025
More Decks by 為藤アキラ
See All by 為藤アキラ
Agent ServerはWeb Serverではない。ADKで考えるAgentOps
akiratameto
0
190
AI Agent Vertex AI Agent Builder × A2A × ADKで繋げるマルチエージェント
akiratameto
1
140
Amazon Bedrockで実現する堅牢なデータエンジニアリング
akiratameto
1
120
Bedrock カスタムモデルvs汎用モデルの比較
akiratameto
1
160
Vertex AIで実現するLLMデータアノテーションの効率化と自動化
akiratameto
0
210
Amazon Bedrock Agents (ナレッジベースの種類)
akiratameto
1
310
DeepSeek-R1をカスタムモデルとしてAmazon Bedrockにインポートし活用
akiratameto
0
260
Amazon Bedrock Agents (基本編)
akiratameto
0
240
SageMaker Feature Storeを活かしたLLM推論
akiratameto
1
120
Other Decks in Technology
See All in Technology
SONiCのLinuxベースを活かしたZabbix監視
sonic
0
180
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
110
気軽に使える"情報のハブ"としてのNotion活用 〜フロー情報の集積点 と、 Claude Code × Notion AI〜
syucream
1
140
【2026年版】 ベクトル検索䛸 Embedding最前線
mocobeta
2
220
【Cyber-sec+】経営層を"動かす"ための考え方
hssh2_bin
0
190
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
1.1k
なぜ Platform Engineering の土台に Kubernetes を選ぶのか
r4ynode
2
650
連合学習と機密コンピューティング
lycorptech_jp
PRO
0
120
Bucharest Tech Week 2026 - Reinventing testing practices in the AI era
edeandrea
PRO
1
160
日本 Fintech 未来予測レポート 2027〜2028年(オリジナル版)
8maki
0
2.2k
MCP Appsを作ってみよう
iwamot
PRO
4
670
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
3k
Featured
See All Featured
A designer walks into a library…
pauljervisheath
211
24k
A Tale of Four Properties
chriscoyier
163
24k
BBQ
matthewcrist
89
10k
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
610
Visualization
eitanlees
152
17k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
71
40k
Speed Design
sergeychernyshev
33
1.8k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
390
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
590
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
160
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
56k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Transcript
OpsJAWS Meetup33 AIOps 2025/03/04 Amazon Bedrockガードレールで守る 安全なAI運用 株式会社BLUEISH 代表取締役CEO兼CTO 為藤アキラ
@AkiraTameto
為藤 アキラ (Akira Tameto) 株式会社BLUEISH 代表取締役 CEO兼CTO ・AWS歴12年 ・直近のAIプロジェクト マルチAIエージェントサービス
「BLUEISH Agents」の開発 自己紹介
AI Ops観点での安全なAI運用の重要性 • 大規模言語モデル(LLM)の活用が企業で急増 • 不適切コンテンツ / 機密漏洩リスクが企業が抱える大きな課題 • 運用担当
(Ops)としては監視 / アラート / ポリシー管理が必須 • インシデントが起きると信用問題 / 法的リスクに直結
Amazon Bedrock ガードレールとは? • Amazon Bedrock のエンタープライズ向け機能の一つ • 生成AIの不適切な入力・出力を制御し、企業ポリシーに合わせてフィルタリングする仕組み •
モデル種類にかかわらず一貫した安全対策を適用可能 アプリケーション ユーザー ガードレール Amazon Bedrock LLMモデル 不適切な入力をブロック フィルタ 出力 入力
ガードレールの4つのフィルター 1. Denied topics → 回答してはいけないトピックを自然言語ベースで設定 2. Content filters
→ ヘイト・差別・暴力などを検知し自動遮断 3. Sensitive information filters (PIIフィルター) → 個人情報・機密情報が出力されそうになったらブロック/マスク 4. Word filters → 特定の単語やフレーズを指定してフィルタリング
AI運用での課題 1. 回答できないトピックをどう管理するか? 2. 不適切コンテンツをどう遮断するか? 3. 個人情報・機密をどう守るか?
課題に対しての解決! Amazon Bedrock ガードレールの機能! 1. 回答できないトピックをどう管理するか? → 「 」
で回答禁止領域をシステム的にブロック 2. 不適切コンテンツをどう遮断するか? 3. 個人情報・機密をどう守るか? Denied topics
課題に対しての解決! Amazon Bedrock ガードレールの機能! 1. 回答できないトピックをどう管理するか? → 「 」
で回答禁止領域をシステム的にブロック 2. 不適切コンテンツをどう遮断するか? → 「 」 でリアルタイムでヘイト・差別・暴力を検出 3. 個人情報・機密をどう守るか? Denied topics Content filters
課題に対しての解決! Amazon Bedrock ガードレールの機能! 1. 回答できないトピックをどう管理するか? → 「 」
で回答禁止領域をシステム的にブロック 2. 不適切コンテンツをどう遮断するか? → 「 」 でリアルタイムでヘイト・差別・暴力を検出 3. 個人情報・機密をどう守るか? → 「 」 で個人情報を自動マスキング Denied topics Content filters Sensitive information filters
Amazon Bedrock ガードレールの強みは「事前防御」 Amazon Bedrockのガードレールは、この「 」を複数モデルに対して統一ポリシーで実 行できるのが強みです。 「 」とは、LLMに不適切な回答を渡す前に、不適切なやり取りや危険な内容が存在しな いかを自動的にフィルタリング・ブロックする仕組みを指します。
事前防御 事前防御 アプリケーション ユーザー カードレール Amazon Bedrock LLMモデル 不適切な入力をブロック フィルタ 出力 入力 事前防御!
Amazon Bedrock ガードレールによる保護体制の比較 vs 事前防御(Proactive Defense) 事後防御(Reactive Defense) 入力ガードレール 出力ガードレール
LLMモデル 安全な応答 事前防御の特 ユーザーに不適切なコンテンツが届く前に遮x 入出力の両方でフィルタリングを実g 問題が発生する前にリスクを低 レビュテーションと信頼の保護に効果的 事後防御の課Ù 不適切なコンテンツが既にユーザーに届いた後の対À 肥大が発生した後の修復は信頼回復が困± 問題検出までのタイムラグが発生する可能¦ レビュテーションリスクと法的リスクが高い 応答(未フィルタ) 潜在的リスクあり インシデント対応 LLMモデル 問題への対応タイミングが 異なる モニタリングで問題検出!
AI Opsとしての設計から運用までの流れ ガードレールをきちんと生かすには設計から運用まで多層的に考えるのが重要。 fc 初期設計で安全策を組み込む c 多層防御と継続モニタリング Bedrock Guardrails+
IAM/ネットワーク 制御+定期アセスメンl CloudWatchなどでコンテンツブロック数 を監視、異常値を即発見 c ハルシネーション対策・PII保護 RAG(検索拡張型)との併用や幻覚検出設 定、PIIマスク設定のテスト Çc インシデント対応計画 もし不適切回答が漏れた場合、どのように 修正・ユーザー通知・再発防止するかまで ルール化 úc 権限管理と変更管理の徹底 ガードレールの設定変更には承認フローを 導入し、CloudTrailでログを追跡 システム全体でガードレールの導入を 前提にし、セキュリティ要件を明確化
インシデント対応計画の深掘りと運用サイクル インシデント対応サイクル 不適切な応答発生時の対応プロセス a ベースラインとして設定しているガードレール ルールが正しく適用されているか確認 (IAM, Config, Guardrailsバージョン等V a
問題の回答や入力ログを精査し、どういう経緯 でガードレールを抜けたか (新種の不適切ト ピック? NGワードのすり抜け? ルール記載漏 れ?) a 必要に応じてガードレールを強化 (新たなNGワード 追加、トピック拒否拡張などV a 問題影響範囲を特定し、既に不適切回答を受 取ったユーザーへのフォロー(謝罪や回答再送) a CloudWatchアラームが発火 (ブロック回数急増、 またはブロック激減V a ユーザーからの「不適切回答があった」という通報 a 設定変更ミス、ガードレールの仕様上の限界、 モデルのバージョンアップによる動作変化など を洗い出h a ガードレール漏れが再発しないように運用ルー ルやチェック体制を修正 a 追加テストケースやレッドチーム評価の 実¤ a IAMポリシー・Configルールで「常に ガードレールを有効にする」強制ルール を導入す© a ユーザー通報フローの強化、開発チー ム・セキュリティチームとの連携プロセ ス見直し ② 初動対応 ① 検知 ③ 封じ込め ④ 根本原因 の調査 ⑤ 再発防止策
まとめ Amazon Bedrock ガードレール 事前防御型で複数モデルを一括管` W ガードレール +
他サービスと組み合わせ Bedrockに CloudWatch監視 / IAM / Config等と組み合わせてリスク低減 3. AI Ops視点でAI運用成功の為のサイクル セキュリティ要件の明確化 + 継続的なポリシー更新 + インシデント計画
Thank You!