Amazon Bedrock Custom model importを試してみる

Amazon Bedrock Custom Model Importを試してみる立野祐太 2025.02.19 ©BLUEISH 2024.
All rights reserved.

立野祐太 Yuta Tateno ・Go、GCPでの開発・運用バックエンドエンジニア自己紹介 ©BLUEISH 2024. All
rights reserved.

©BLUEISH 2024. All rights reserved. 最新のオープンソースモデルや独自のカスタムモデルをすぐに・簡単に・安全に使いたい！ 👉Amazon Bedrock Custom
Model Importで実現できます

©BLUEISH 2024. All rights reserved. 独自にトレーニングしたモデルやオープンソースモデルを Bedrock上でAPI として運用できる機能 Amazon Bedrock
Custom Model Import とは

- オープンソースモデル、外部でトレーニングしたモデル、自社開発モデルをBedrockで使える - APIとしてサーバー管理不要で簡単に利用できる - AWSのナレッジベース、エージェント、ガードレールなどのツールと統合可能 - AWS
のセキュリティとコンプライアンスの枠組み内で安全に運用 ©BLUEISH 2024. All rights reserved. 主な利点

©BLUEISH 2024. All rights reserved. 対応アーキテクチャ - Mistral - Mixtral
- Flan - Llama 2、Llama3、Llama3.1、Llama3.2、および Llama 3.3 👉すべてのモデルが利用できるわけではない。アーキテクチャの変換や蒸留などの工夫が必要対応リージョン - 米国東部 (バージニア北部) - 米国西部 (オレゴン)

©BLUEISH 2024. All rights reserved. - カスタムモデルユニット：インポートしたモデルのアーキテクチャ、パラメータ数、コンテキスト長などに基づいて消費されるリソース単位。インポートした際に決定される。 - 5
分単位で料金が発生 - リクエストによってインスタンス数が自動でスケールカスタムモデルユニットあたりの推論コスト/分: 0.0785(USD) カスタムモデルユニットあたりのストレージコスト/月: 1.95(USD) 料金体系

©BLUEISH 2024. All rights reserved. Llma 3.1 70Bを７分間利用した例カスタムモデルユニットあたりの推論コスト/分: $0.0785
カスタムモデルユニットあたりのストレージコスト/月: $1.95 カスタムモデルユニット数: 8 (ドキュメント記載の値を参考) 利用時間: 7分 5 分単位でのウィンドウ数: 2 インスタンス数：１推論コスト：0.0785 * 8 * 2 * 1 = $1.256 👉軽量なモデルで推論速度が速いほどコストは安くなりそうストレージコスト：1.95 * 8 = $15.6 / 月

Amazon Bedrock Custom model importを試してみる

Amazon Bedrock Custom model importを試してみる

ttnyt8701

More Decks by ttnyt8701

Other Decks in Programming

Featured

Transcript

Amazon Bedrock Custom Model Importを試してみる立野祐太 2025.02.19 ©BLUEISH 2024.

立野祐太 Yuta Tateno ・Go、GCPでの開発・運用バックエンドエンジニア自己紹介 ©BLUEISH 2024. All

©BLUEISH 2024. All rights reserved. 最新のオープンソースモデルや独自のカスタムモデルをすぐに・簡単に・安全に使いたい！ 👉Amazon Bedrock Custom

©BLUEISH 2024. All rights reserved. 独自にトレーニングしたモデルやオープンソースモデルを Bedrock上でAPI として運用できる機能 Amazon Bedrock

- オープンソースモデル、外部でトレーニングしたモデル、自社開発モデルをBedrockで使える - APIとしてサーバー管理不要で簡単に利用できる - AWSのナレッジベース、エージェント、ガードレールなどのツールと統合可能 - AWS

©BLUEISH 2024. All rights reserved. 対応アーキテクチャ - Mistral - Mixtral

©BLUEISH 2024. All rights reserved. - カスタムモデルユニット：インポートしたモデルのアーキテクチャ、パラメータ数、コンテキスト長などに基づいて消費されるリソース単位。インポートした際に決定される。 - 5

©BLUEISH 2024. All rights reserved. Llma 3.1 70Bを７分間利用した例カスタムモデルユニットあたりの推論コスト/分: $0.0785

Deep Seekカスタムモデルをインポートしてみる ©BLUEISH 2024. All rights reserved.

©BLUEISH 2024. All rights reserved. 1. モデルの準備アーキテクチャに対応した任意のモデルを用意今回はDeepSeek-R1-Distill-Llama-8Bを量子化したカスタムモデルをデプロイ

©BLUEISH 2024. All rights reserved. 2. S3バケットにモデルをアップロード

©BLUEISH 2024. All rights reserved.

©BLUEISH 2024. All rights reserved. 4. Custom Model Importからモデルをインポート

©BLUEISH 2024. All rights reserved.

©BLUEISH 2024. All rights reserved.

©BLUEISH 2024. All rights reserved. 5. インポートしたモデルを実行してみる

©BLUEISH 2024. All rights reserved.

©BLUEISH 2024. All rights reserved.

©BLUEISH 2024. All rights reserved. 最新のオープンソースモデル、外部でカスタムしたモデル、自社開発モデルなどを速く、簡単、安全、効率的にAWS上で活用できる！まとめ