Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Bedrockで実現する堅牢なデータエンジニアリング
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
為藤アキラ
March 04, 2025
Technology
120
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon Bedrockで実現する堅牢なデータエンジニアリング
為藤アキラ
March 04, 2025
More Decks by 為藤アキラ
See All by 為藤アキラ
Agent ServerはWeb Serverではない。ADKで考えるAgentOps
akiratameto
0
190
AI Agent Vertex AI Agent Builder × A2A × ADKで繋げるマルチエージェント
akiratameto
1
140
[OpsJAWS Meetup33 AIOps] Amazon Bedrockガードレールで守る安全なAI運用
akiratameto
2
380
Bedrock カスタムモデルvs汎用モデルの比較
akiratameto
1
160
Vertex AIで実現するLLMデータアノテーションの効率化と自動化
akiratameto
0
210
Amazon Bedrock Agents (ナレッジベースの種類)
akiratameto
1
310
DeepSeek-R1をカスタムモデルとしてAmazon Bedrockにインポートし活用
akiratameto
0
260
Amazon Bedrock Agents (基本編)
akiratameto
0
240
SageMaker Feature Storeを活かしたLLM推論
akiratameto
1
120
Other Decks in Technology
See All in Technology
20260619 私の日常業務での生成 AI 活用
masaruogura
1
220
200個のGitHubリポジトリを横断調査したかった
icck
0
130
LayerXにおけるセキュリティ管理の現在地と次の一手
tosho
0
210
AI駆動開発を通して感じた、 AI時代のデザイナーの役割変化
whisaiyo
3
2.2k
小さくはじめるSLI/SLO ~育てながら組織に定着させる実践知~ / Starting Small with SLI/SLOs: Building Adoption Through Continuous Growth
nari_ex
7
2k
2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算
line_developers_tw
PRO
0
1.1k
AAIFに入ってみた ~内から見えるコミュニティ動向~
sato4
0
240
中期計画、2回作ってみた ~業務委託と正社員、両方の視点から~
demaecan
1
900
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
400
いまさら聞けない「仕様駆動開発入門」 〜AI活用時代の開発プロセスを考える〜
findy_eventslides
2
140
Chainlitで作るお手軽チャットUI
ynt0485
0
260
RAG を使わないという選択肢
tatsutaka
1
250
Featured
See All Featured
Practical Orchestrator
shlominoach
191
11k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
210
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
200
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
330
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
720
Abbi's Birthday
coloredviolet
2
8.1k
Unsuck your backbone
ammeep
672
58k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
56k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
54k
Transcript
AWS活用 AI/ML/LLM #5 機械学習/大規模言語モデル データエンジニアリング Amazon Bedrockで実現する 堅牢なデータエンジニアリング 株式会社BLUEISH 代表取締役CEO兼CTO
為藤アキラ @AkiraTameto
為藤 アキラ (Akira Tameto) 株式会社BLUEISH 代表取締役 CEO兼CTO ・AWS歴12年 ・直近のAIプロジェクト マルチAIエージェントサービス
「BLUEISH Agents」の開発 自己紹介
データエンジニアリングとは? データエンジニアリングの定義 大規模データを収集 / 加工 / 保管 / 配信するためのシステムやインフラを設計 /
開発 / 運用し、 組織の意思決定やデータ活用を支える基盤を構築する分野 データエンジニアリングの目2 1 大規模データを扱い、後続(分析・AI活用など)で使いやすい形にす 1 データ品質・セキュリティ・パフォーマンスを担保する
AI / ML観点でのデータエンジニアリングとは? 基本的なデータエンジニアリングのプロセス 生データの収集 ① 変換 ② 提供 ④
保存 ③
データ分析観点でのデータエンジニアリングとは? データ分析観点でのデータエンジニアリングのプロセス 生データの収集 ① 変換 (ETL/ELT処理) ② 提供 ④ 保存
(データウェアハウス/ データレイク) ③
データ分析観点でのデータエンジニアリングをAWS運用で当てはめると データ分析観点でのデータエンジニアリングのプロセス (AWS) 生データの収集 ① 変換 (ETL/ELT処理) ② 提供 ④
保存 (データウェアハウス/ データレイク) ③ { Amazon Kinesij { AWS Data Migration Servics { AWS IoT Core { AWS Glus { EM { Data Pipelins { Athena { Amazon S¢ { Amazon Redshif { AWS Lake Formation { Amazon QuickSigh { API Gatewaº { AWS Glue Data Catalog
AI / ML観点でのデータエンジニアリングをAWS運用で当てはめると AI / ML観点でのデータエンジニアリングのプロセス 生データの収集 ① 変換 →
前処理 (特徴量抽出 / ラベリング) ② 提供 (推論エンドポイント) ④ 保存 (学習用データセット) ③
AI / ML観点でのデータエンジニアリングをAWS運用で当てはめると AI / ML観点でのデータエンジニアリングのプロセス (AWS) 生データの収集 ① 変換
(ETL/ELT処理) ② 提供 ④ 保存 (データウェアハウス/ データレイク) ③ Amazon Kinesio AWS Data Migration Servicx S3 AWS Glux EM SageMaker Processing S3 + SageMaker Ground Truth SageMaker Endpoint
LLM観点でのデータエンジニアリングとは? LLM観点でのデータエンジニアリングのプロセス + LLM特有の工程非構造化データが多い! 生データの収集 ① 変換 → 前処理 (PIIマスキング/
トークナイゼーション) ② 提供 (LLM推論エンドポイント / チャットサービス) ④ 保存 (データレイク/ ベクトル系のDB) ③
LLM観点でのデータエンジニアリングをAWS運用で当てはめると LLM観点でのデータエンジニアリングのプロセス (AWS) 生データの収集 ① 変換 (ETL/ELT処理) ② 提供 ④
保存 (データウェアハウス/ データレイク) ③ x Kinesis Firehosm x Glue Crawler x S3 x AWS Glum x EM x Amazon Comprehend x S3 x Amazon OpenSearch x Amazon Bedrock
生成AI時代のデータ課題やデータエンジニアリングの重要性 • 大規模言語モデル(LLM)の活用が企業で急増 • 不適切コンテンツ / 機密漏洩リスクが企業が抱える大きな課題 • 監視 /
アラート / ポリシー管理が必須 • インシデントが起きると信用問題 / 法的リスクに直結
Amazon Bedrock ガードレールとは? • Amazon Bedrock のエンタープライズ向け機能の一つ • 生成AIの不適切な入力・出力を制御し、企業ポリシーに合わせてフィルタリングする仕組み •
モデル種類にかかわらず一貫した安全対策を適用可能 アプリケーション ユーザー ガードレール Amazon Bedrock LLMモデル 不適切な入力をブロック フィルタ 出力 入力
ガードレールの4つのフィルター 1. Denied topics → 回答してはいけないトピックを自然言語ベースで設定 2. Content filters
→ ヘイト・差別・暴力などを検知し自動遮断 3. Sensitive information filters (PIIフィルター) → 個人情報・機密情報が出力されそうになったらブロック/マスク 4. Word filters → 特定の単語やフレーズを指定してフィルタリング
LLMに関する、データパイプラインにおける主要課題 生データからのデータパイプラインは様々な課題がある (1) 機密情報を含む生データの扱い ↓ (2) 不適切コンテンツ混入 ↓ (3) マルチモデル運用のポリシー管理負担
↓ (4) インシデント対応の難しさ
データパイプラインにおける主要課題 生データからのデータパイプラインは様々な課題がある (1) 機密情報を含む生データの扱い → 「 」 で個人情報を自動マスキング (2)
不適切コンテンツ混入 → 「 」 でリアルタイムでヘイト・差別・暴力を検出 (3) マルチモデル運用のポリシー管理負担 → 「 」 で回答禁止領域をシステム的にブロック (4) インシデント対応の難しさ → 「 」で解決! Sensitive information filters Content filters Denied topics 安全なAI Ops
Amazon Bedrock ガードレールの強みは「事前防御」 Amazon Bedrockのガードレールは、この「 」を複数モデルに対して統一ポリシーで実 行できるのが強みです。 「 」とは、LLMに不適切な回答を渡す前に、不適切なやり取りや危険な内容が存在しな いかを自動的にフィルタリング・ブロックする仕組みを指します。
事前防御 事前防御 アプリケーション ユーザー カードレール Amazon Bedrock LLMモデル 不適切な入力をブロック フィルタ 出力 入力 事前防御!
Amazon Bedrock ガードレールによる保護体制の比較 vs 事前防御(Proactive Defense) 事後防御(Reactive Defense) 入力ガードレール 出力ガードレール
LLMモデル 安全な応答 事前防御の特 ユーザーに不適切なコンテンツが届く前に遮x 入出力の両方でフィルタリングを実m 問題が発生する前にリスクを低 レビュテーションと信頼の保護に効果的 事後防御の課Ú 不適切なコンテンツが既にユーザーに届いた後の対¹ 肥大が発生した後の修復は信頼回復が困º 問題検出までのタイムラグが発生する可能¤ レビュテーションリスクと法的リスクが高い 応答(未フィルタ) 潜在的リスクあり インシデント対応 LLMモデル 問題への対応タイミングが 異なる モニタリングで問題検出!
AI Opsとしての設計から運用までの流れ ガードレールをきちんと生かすには設計から運用まで多層的に考えるのが重要。 e` 初期設計で安全策を組み込む y` 多層防御と継続モニタリング Bedrock Guardrails+
IAM/ネットワーク 制御+定期アセスメンo CloudWatchなどでコンテンツブロック数 を監視、異常値を即発見 ` ハルシネーション対策・PII保護 RAG(検索拡張型)との併用や幻覚検出設 定、PIIマスク設定のテスト Ç` インシデント対応計画 もし不適切回答が漏れた場合、どのように 修正・ユーザー通知・再発防止するかまで ルール化 ú` 権限管理と変更管理の徹底 ガードレールの設定変更には承認フローを 導入し、CloudTrailでログを追跡 システム全体でガードレールの導入を 前提にし、セキュリティ要件を明確化
AI Opsとしての設計から運用までの流れ (データエンジニアリング観点) ガードレールをきちんと生かすには設計から運用まで多層的に考えるのが重要。 yt 初期設計で安全策を組み込む t 多層防御と継続モニタリング Bedrock
Guardrails+ IAM/ネットワーク 制御+定期アセスメン} CloudWatchなどでコンテンツブロック数 を監視、異常値を即発見 §t ハルシネーション対策・PII保護 RAG(検索拡張型)との併用や幻覚検出設 定、PIIマスク設定のテスト Õt インシデント対応計画 もし不適切回答が漏れた場合、どのように 修正・ユーザー通知・再発防止するかまで ルール化 t 権限管理と変更管理の徹底 ガードレールの設定変更には承認フローを 導入し、CloudTrailでログを追跡 システム全体でガードレールの導入を 前提にし、セキュリティ要件を明確化
まとめ fg データ分析 / ML / LLM でのデータエンジニアリングのアプローチの違G 2g Amazon
Bedrock ガードレール + 他サービスで安全なLLMのデータ運 g AI OpsにおけるデータエンジニアリングでのAI運用成功の為のサイクル
Thank You!