Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DeepSeek for Amazon Bedrock

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for Morita Morita
February 08, 2025
87

DeepSeek for Amazon Bedrock

Avatar for Morita

Morita

February 08, 2025
Tweet

More Decks by Morita

Transcript

  1. ⾃⼰紹介 •名前 • 森⽥ ⼒ •所属 • クラスメソッド株式会社 • クラウド事業本部

    コンサルティング部 •出⾝‧住まい • 出⾝:熊本 • 現在:福岡 •好きなAWSサービス • AWS Lambda • Amazon Bedrock re:Invent2024 参加してきました!
  2. 性能 • OpenAI-o1相当 モデル • 蒸留モデルも提供 ライセンス • OSS →

    AWSでも使えるようにしたい! DeepSeek-R1 参考:https://api-docs.deepseek.com/news/news250120
  3. l AWSマネージドな機能が利⽤できる l ガードレール l エージェント など l サーバレス l

    インフラ管理なし l API実⾏時の共通のインターフェース l モデルID, パラメータを変えるだけで実⾏可能 l 基盤モデルとしてサポートしているプロバイダー l Amazon, Anthropic, Meta など Amazon Bedrock
  4. l AWSマネージドな機能が利⽤できる l ガードレール l エージェント など l サーバレス l

    インフラ管理なし l API実⾏時の共通のインターフェース l モデルID, パラメータを変えるだけで実⾏可能 l 基盤モデルとしてサポートしているプロバイダー l Amazon, Anthropic, Meta など → DeepSeek 対応していない Amazon Bedrock
  5. l re:Invent 2024 で発表 l 基盤モデル以外を利⽤できるサービス l DeepSeek以外のモデルも利⽤可能 l 数クリックでデプロイ可能

    l SageMaker エンドポイントにデプロイ l 利⽤料⾦ l Software cost(ライセンス) l インフラ( SageMaker エンドポイント) Amazon Bedrock Marketplace ※ 2024/02/07時点
  6. Amazon Bedrock セキュリティ l Amazon Bedrock では、プロンプトおよび AI のレスポンスを保存またはログに記 録することはありません。

    l データがモデルプロバイダーと共有されたり、ベースモデルの改善に使⽤された りすることはありません。
  7. • InvokeModel API で呼び出し l Streaming出⼒対応 l Converse API 未対応

    l ApplyGuardrail API でガードレール利⽤可能 モデル呼び出し response = bedrock_runtime.invoke_model_with_response_stream( modelId='arn:aws:sagemaker:リージョン:アカウントID:endpoint/エンドポイント名’, body=json.dumps(request_body), contentType='application/json’, accept='application/json’, performanceConfigLatency='standard' )
  8. l re:Invent 2024 より前の10⽉にGA l Bedrock にモデルをインポート l モデルデータが必要 l

    サポートしているアーキテクチャのみ(llamaなど) l 利⽤料⾦ l Custom Model Unit(モデルに応じて異なる) l ストレージコスト カスタムモデルインポート
  9. l メリット l Fine-tuningされたモデルも利⽤することができる l 例:蒸留モデルを独⾃データを使って学習させる l モデル推論時のカスタマイズができる l tokenizer_config.json

    で chat_templateの指定(Converse API対応) l デメリット l モデルのダウンロードが必要なため、時間を要する カスタムモデルインポート