Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amazon SageMaker AIでモデル開発からデプロイまで試す

Shota Totsuka
March 12, 2025
12

Amazon SageMaker AIでモデル開発からデプロイまで試す

Shota Totsuka

March 12, 2025
Tweet

Transcript

  1. ©Blueish 2025. All rights reserved. 自己紹介 株式会社BLUEISH
 AI Lead Engineer

    @ t o t s u m a r u _ d o t 戸塚 翔太 o 普段はLLMアプリケーションの開発をしていまg o 現在は法人向けAIエージェントプラットフォーム「BLUEISH Agents」 の開発を担当していまg o 静岡県(浜松)に住んでいますが、今年中に東京へ引っ越したい...
  2. データの前処理 Amazon Textract PDFや画像データからテキストや表 データを自動抽出するサービス AWS Glue DataBrew ノーコードでデータのクレンジングや 変換ができるサービス

    AWS Glue ETL(抽出・変換・ロード)処理を コードベースで柔軟に実行できる
 データ統合サービス Amazon SageMaker 
 Ground Truth モデルのトレーニングに必要な
 高品質なラベル付きデータセットを
 効率よく作成するためのサービス Amazon SageMaker 
 Data Wrangler ノーコードでデータの準備・前処理・ 分析までをサポートするサービス Amazon Comprehend テキストデータからエンティティ抽出 や感情分析を行う
 自然言語処理サービス ©Blueish 2025. All rights reserved.
  3. 学習 SageMaker AIのワークフロー % Pipeline % % % % Â

    ML パイプラインを構築して管理するためのツー‘ Kubernetesのオーケストレーショ€ ~ K8sクラスターの SageMaker AIカスタム演算子とKubeflow Pipelines のコンポーネンw SageMakerノートブックジョs ~ Jupyter Notebook のオンデマンドまたはスケジュール済み非インタラクティブなバッチ実H AirflowワークフロŽ ~ Airflow ワークフローを作成および管理するための設定をエクスポートする SageMaker APk Step Function ~ リソースを個別にプロビジョニングすることなく SageMaker AI インフラストラクチャを調整する Python の複数ステッ プの ML ワークフロー ©Blueish 2025. All rights reserved.
  4. デプロイ 推論エンドポイント ©Blueish 2025. All rights reserved. リアルタイム推論 一度に 1

    つの予測を行う永続的なリアルタイム エンドポイント サーバーレス推論 トラフィックの急増の間にアイドル期間があり、コールドスタートを許容 できるワークロード 非同期推論 最大 1 GB の大きなペイロードサイズ、長い処理時間、ほぼリアルタイムの レイテンシー要件を持つリクエスト バッチ変換 データセット全体の予測を取得する
  5. データの前処理 Amazon Textract PDFや画像データからテキストや表 データを自動抽出するサービス AWS Glue DataBrew ノーコードでデータのクレンジングや 変換ができるサービス

    AWS Glue ETL(抽出・変換・ロード)処理を コードベースで柔軟に実行できる
 データ統合サービス Amazon SageMaker 
 Ground Truth モデルのトレーニングに必要な
 高品質なラベル付きデータセットを
 効率よく作成するためのサービス Amazon SageMaker 
 Data Wrangler ノーコードでデータの準備・前処理・ 分析までをサポートするサービス Amazon Comprehend テキストデータからエンティティ抽出 や感情分析を行う
 自然言語処理サービス ©Blueish 2025. All rights reserved.
  6. デプロイ 推論エンドポイント ©Blueish 2025. All rights reserved. リアルタイム推論 一度に 1

    つの予測を行う永続的なリアルタイム エンドポイント サーバーレス推論 トラフィックの急増の間にアイドル期間があり、コールドスタートを許容 できるワークロード 非同期推論 最大 1 GB の大きなペイロードサイズ、長い処理時間、ほぼリアルタイムの レイテンシー要件を持つリクエスト バッチ変換 データセット全体の予測を取得する