Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock カスタムモデルvs汎用モデルの比較
Search
為藤アキラ
February 18, 2025
Technology
160
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Bedrock カスタムモデルvs汎用モデルの比較
為藤アキラ
February 18, 2025
More Decks by 為藤アキラ
See All by 為藤アキラ
Agent ServerはWeb Serverではない。ADKで考えるAgentOps
akiratameto
0
190
AI Agent Vertex AI Agent Builder × A2A × ADKで繋げるマルチエージェント
akiratameto
1
140
[OpsJAWS Meetup33 AIOps] Amazon Bedrockガードレールで守る安全なAI運用
akiratameto
2
380
Amazon Bedrockで実現する堅牢なデータエンジニアリング
akiratameto
1
120
Vertex AIで実現するLLMデータアノテーションの効率化と自動化
akiratameto
0
210
Amazon Bedrock Agents (ナレッジベースの種類)
akiratameto
1
310
DeepSeek-R1をカスタムモデルとしてAmazon Bedrockにインポートし活用
akiratameto
0
260
Amazon Bedrock Agents (基本編)
akiratameto
0
240
SageMaker Feature Storeを活かしたLLM推論
akiratameto
1
120
Other Decks in Technology
See All in Technology
新しいVibe Codingと”自走”について
watany
6
330
LayerX コーポレートエンジニアリング室におけるサプライチェーンセキュリティへの取り組み / Supply Chain Security at LayerX Corporate Engineering
yuyatakeyama
2
590
Claude Code の Sandbox 機能を Anthropic Sandbox Runtime(srt) で試そう!/lets-play-anthropic-sandbox-runtime
tomoki10
1
620
エラーバジェットのアラートのタイミングを考える.pdf
kairim0
0
150
LLMにもCAP定理があるという話
harukasakihara
0
380
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
2.4k
脆弱性対応、どこで線を引くか
rymiyamoto
1
400
【2026年版】 ベクトル検索䛸 Embedding最前線
mocobeta
2
220
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
140
入門!AWS Blocks
ysuzuki
1
130
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
110
2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算
line_developers_tw
PRO
0
1.1k
Featured
See All Featured
Unsuck your backbone
ammeep
672
58k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
210
Discover your Explorer Soul
emna__ayadi
2
1.1k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
2k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
What's in a price? How to price your products and services
michaelherold
247
13k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1.1k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Building AI with AI
inesmontani
PRO
1
1.1k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Transcript
AWS活用 Amazon Bedrock #3 カスタムモデル vs 汎用モデル 実用シナリオでの比較 株式会社BLUEISH 代表取締役CEO兼CTO
為藤アキラ @AkiraTameto
為藤 アキラ (Akira Tameto) 株式会社BLUEISH 代表取締役 CEO兼CTO ・AWS歴12年 ・直近のAIプロジェクト
・画像を中心とした機械学習とLLM のハイブリッドのアーキテクト 自己紹介
今回のゴール カスタムモデル (ファインチューニング)でモデルを作る事
DEMOとユースケース1 【ユースケース】 カスタマーセンターの問い合わせ対応LLM カスタムモデル vs 汎用モデル(Titan)
DEMOとユースケース1 問い合わせに困っているスタッフの方々 どうにかして解決してあげたい・・・
DEMOとユースケース2 しっかりご案内して、最後にお茶を出せば落ち着くのでは?
データセットを準備する データの準備から
データセットを準備する フォーマットは決まっているので注意 https://docs.aws.amazon.com/bedrock/latest/userguide/model-customization-prepare.html AWS公式
データセットを準備する { " ": " ", " ": "
" }, prompt completion 注文した商品がまだ届いていない! ご不便をおかけして申し訳ありません。 まずは以下の手順でご確認ください。 1. ご注文確認メールに記載されている追跡番号をお手元にご用意ください。 2. 当社の配送追跡ページにアクセスし、追跡番号を入力してください。 3. 配送状況が更新されていない場合は、カスタマーサポートまでお問い合わせください。 そして、忙しい中でもほっと一息つけるよう、例えばジャスミン茶、ダージリンティー、またはウーロン茶な どもお楽しみいただければ幸いです。 データのイメージ
データセットを準備する テストデータを生成。トレーニングデータ(100件)、検証データ(50件)を用意。
学習関連のデータを格納するバケットの作成
今回の目次とゴール
カスタムモデルの作成 カスタムモデルの作成へ
カスタムモデルの種類
それぞれの特徴 ・Fine-tuning (微調整) すでに学習済みのモデルを、特定のタスクやドメインに合わせて追加学習すること ・Distillation (蒸留) 大規模な「教師モデル」の知識を、より軽量な「生徒モデル」に転送する技術です。 生徒モデルは教師モデルに近い性能を発揮しつつ、計算資源やメモリの消費を抑え、実運用に適したサイズになります。 ・Continued pre-training
(事前トレーニングの継続) 既存の大規模モデルに対して、さらに追加の一般的またはドメイン固有のデータで学習を続けるプロセスです。 これにより、モデルの言語理解能力や専門性が向上し、後の微調整(fine-tuning)の効果が高まる場合があります。 ・RAG (検索拡張生成) 外部の知識ソース(ドキュメントやデータベース)から関連情報を検索(リトリーバル)し、その情報を元に生成(ジェネレーション)を行う手法。 これによりモデルはより正確で信頼性の高い回答を提供できるようになる。
それぞれの特徴 ・Fine-tuning (微調整) すでに学習済みのモデルを、特定のタスクやドメインに合わせて追加学習すること ・Distillation (蒸留) 大規模な「教師モデル」の知識を、より軽量な「生徒モデル」に転送する技術です。 生徒モデルは教師モデルに近い性能を発揮しつつ、計算資源やメモリの消費を抑え、実運用に適したサイズになります。 ・Continued pre-training
(事前トレーニングの継続) 既存の大規模モデルに対して、さらに追加の一般的またはドメイン固有のデータで学習を続けるプロセスです。 これにより、モデルの言語理解能力や専門性が向上し、後の微調整(fine-tuning)の効果が高まる場合があります。 ・RAG (検索拡張生成) 外部の知識ソース(ドキュメントやデータベース)から関連情報を検索(リトリーバル)し、その情報を元に生成(ジェネレーション)を行う手法。 これによりモデルはより正確で信頼性の高い回答を提供できるようになる。
o1 proによる比較 精度は良いが、最新情報、手間、料金ともに厳しい
ファインチューニングのジョブ作成 (モデルの選択)
ファインチューニングのジョブ作成 https://docs.aws.amazon.com/bedrock/latest/userguide/model-customization-prepare.html AWS公式
ファインチューニングのジョブ作成 (モデルの選択)
ファインチューニングのジョブ作成
入力データのセット、ハイパーパラメータのセット
出力データ、サービスアクセスのセット
カスタムモデルの作成準備完了し、トレーニングジョブが実行
トレーニングジョブが実行中 トレーニング時間はデータやモデルによるが、 今回は大体2時間ぐらい
トレーニングが完了し、モデルが出来上がる
今回のモデルの内容
プロビジョンドスループットを購入1
プロビジョンドスループットを購入2
プロビジョンドスループットを購入が完了 大体20分ぐらい
DEMO DEMO
プレイグラウンド (Text)で検証
DEMO Titan Text G1 Express
DEMO Titan Text G1 Express
DEMO Titan Text G1 Express
DEMO Titan Text G1 Express
DEMO Claude 3.5 Sonnet
DEMO Claude 3.5 Sonnet
DEMO Claude 3.5 Sonnet
DEMO Claude 3.5 Sonnet
DEMO カスタムモデル ※不安定なのでDEMO用で急遽 若干パフォーマンスが良いTitanにしました。
DEMO カスタムモデル
DEMO カスタムモデル (1回目)
DEMO カスタムモデル
DEMO カスタムモデル (2回目)
DEMO カスタムモデル (2回目)
まとめ
まとめ Amazon Bedrockでファインチューニングは割と簡単にできR 元のモデルと比べて少ないデータでも良い結果を出せR とはいえファインチューニングはコストがかかるので、必要なタイミングで使うと良い
まとめ
まとめ
Thank You!