Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Sagemaker Jump Startを用いて爆速でモデルを作成してみる
Search
ttnyt8701
March 12, 2025
Programming
3
70
Amazon Sagemaker Jump Startを用いて爆速でモデルを作成してみる
【AWS活用 AI/ML/LLM #6】機械学習/大規模言語モデル モデリング
https://blueish.connpass.com/event/348098/
ttnyt8701
March 12, 2025
Tweet
Share
More Decks by ttnyt8701
See All by ttnyt8701
Gemini CLI のはじめ方
ttnyt8701
1
120
ObsidianをMCP連携させてみる
ttnyt8701
3
580
Claude Codeの使い方
ttnyt8701
2
220
FastMCPでMCPサーバー/クライアントを構築してみる
ttnyt8701
3
190
LangChain Open Deep Researchとは?
ttnyt8701
2
140
Vertex AI Agent Builderとは?
ttnyt8701
4
160
A2A(Agent2Agent )とは?
ttnyt8701
2
350
Amazon Bedrock LLM as a Judgeを試す
ttnyt8701
2
50
Amazon SageMaker Lakehouseでデータのサイロ化による課題を解決する
ttnyt8701
2
34
Other Decks in Programming
See All in Programming
AIコーディングエージェント全社導入とセキュリティ対策
hikaruegashira
16
9.8k
Flutterと Vibe Coding で個人開発!
hyshu
1
250
あなたとJIT, 今すぐアセンブ ル
sisshiki1969
1
640
Go製CLIツールをnpmで配布するには
syumai
2
1.2k
AI時代のドメイン駆動設計-DDD実践におけるAI活用のあり方 / ddd-in-ai-era
minodriven
6
1.4k
あのころの iPod を どうにか再生させたい
orumin
2
2.4k
CEDEC 2025 『ゲームにおけるリアルタイム通信への QUIC導入事例の紹介』
segadevtech
3
860
DataformでPythonする / dataform-de-python
snhryt
0
170
AIに安心して任せるためにTypeScriptで一意な型を作ろう
arfes0e2b3c
0
360
管你要 trace 什麼、bpftrace 用下去就對了 — COSCUP 2025
shunghsiyu
0
410
ライブ配信サービスの インフラのジレンマ -マルチクラウドに至ったワケ-
mirrativ
1
190
JetBrainsのAI機能の紹介 #jjug
yusuke
0
200
Featured
See All Featured
Balancing Empowerment & Direction
lara
2
550
Gamification - CAS2011
davidbonilla
81
5.4k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
21k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Building Applications with DynamoDB
mza
96
6.5k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Visualization
eitanlees
146
16k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Six Lessons from altMBA
skipperchong
28
3.9k
Transcript
Amazon Sagemaker Jump Startを用いて爆速でモデル を作成してみる🚀 2025.03.13 ©BLUEISH 2025. All rights
reserved.
立野 祐太 Yuta Tateno WEB開発(Go、GCP) 画像認識やRAGを用いた開発 WEBエンジニア 自己紹介 ©BLUEISH 2024.
All rights reserved.
ゴール Amazon Sagemaker Jump Startを用いたモデル作成方法を共有し、簡単に爆速でモ デルが作れるイメージを掴んでもらうこと
Amazon Sagemaker Jump Start とは? 機械学習のスターターキット 主な機能 ❏ 事前学習済みモデルの利用 :
すぐに使える AI モデルが多数用意 ❏ 簡単なカスタマイズ : ファインチューニング可能 ❏ 簡単なデプロイ : ボタン数クリックか SDK で本番環境に展開ができる ❏ モデル比較 : 品質や責任に関する指標でモデルを比較・選択ができる ❏ 組織内共有 : チーム内でモデルやノートブックを共有ができる
人物画像を入力することで年齢推定できるモデルを作成する さっそくやってみましょう! 🚀
Sagemaker Studioにアクセス
Jump Start 学習済みのモデルを利用できる
モデル選定 用途: 画像認識を用いた年齢推定
モデル選定
モデル選定 EfficientNet-B3を選択
モデル選定
モデルの検証 デプロイをし、素のモデル出力を確認する
モデルの検証 顔画像を入力し、モデル出力を確認 期待値 : 24 モデルの予測 : jersey モデルの予測 (上位5):
jersey, window shade, Band Aid, sunscreen, bulletproof vest 👉ファインチューニングを行い年齢推定 モデルにしていく
1. 人物画像と年齢のデータセットを収集 2. データセットをラベリング(前処理) 3. ファインチューニングを行う 4. デプロイ 5. モデルを検証
ファインチューニングの流れ
https://susanqq.github.io/UTKFace/ 人物の画像と年齢のデータセットを収集 UTKFaceで1~110歳までの学習データを約1万 枚 データセットの準備
データセットの前処理 ラベリング方法についてモデルページを確認 ディレクトリ名: 正解ラベル、ディレクトリの中: 学習用データとなるようにする
データセットのアップロード S3に前処理したデータセットをアップロード
ファインチューニング
ファインチューニング 1. S3にアップロードしたデータセット の選択 2. ハイパーパラメータの設定など行 う(今回はデフォルト)
ファインチューニング 1万枚のデータに対して約10分で完了(インスタンス:ml.p3.2xlarge) デプロイをしてモデルを検証
モデルの検証 顔画像を入力し、モデル出力を確認 期待値 : 24 モデルの予測 : 14 モデルの予測 (上位5):
14,52,26,27,29 正解はしなかったが、年齢推定モデルを 開発することができた 🚀
モデルの検証 正解はしなかったが、年齢推定モデルを開発することができた 🚀 アジア人のデータセットの学習量を増やす、より適切・高精度なモデル・アルゴリズムを 選択することで精度向上を望めそう!
まとめ 🔰 非エンジニアでもモデルを簡単に作成することが可能 🧠 適切なモデル選定、適切なデータセットがあれば精度向上可能 🚀 学習時間約10分、トータルでも約数十分で爆速開発可能だった (データセットのアップロード時間除く)