Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Sagemaker Jump Startを用いて爆速でモデルを作成してみる
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ttnyt8701
March 12, 2025
Programming
120
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon Sagemaker Jump Startを用いて爆速でモデルを作成してみる
【AWS活用 AI/ML/LLM #6】機械学習/大規模言語モデル モデリング
https://blueish.connpass.com/event/348098/
ttnyt8701
March 12, 2025
More Decks by ttnyt8701
See All by ttnyt8701
Gemini CLI のはじめ方
ttnyt8701
1
300
ObsidianをMCP連携させてみる
ttnyt8701
3
6.8k
Claude Codeの使い方
ttnyt8701
2
450
FastMCPでMCPサーバー/クライアントを構築してみる
ttnyt8701
3
740
LangChain Open Deep Researchとは?
ttnyt8701
2
470
Vertex AI Agent Builderとは?
ttnyt8701
4
440
A2A(Agent2Agent )とは?
ttnyt8701
2
520
Amazon Bedrock LLM as a Judgeを試す
ttnyt8701
2
210
Amazon SageMaker Lakehouseでデータのサイロ化による課題を解決する
ttnyt8701
2
83
Other Decks in Programming
See All in Programming
AI 時代のソフトウェア設計の学び方
masuda220
PRO
29
12k
気づいたらRubyで100作品 ー クリエイティブコーディングが生活の一部になるまで / 100 Ruby Sketches Later: How Creative Coding Became Part of My Life
chobishiba
3
580
Vue × Nuxt × Oxc どこまで使える?実運用の現在地
andpad
0
250
AIとASP.NET Coreで雑Webアプリを作った話
mayuki
0
630
Honoでのサプライチェーン侵害対策 〜 3つのライブラリに学ぶ
yusukebe
6
1.1k
正しくソフトウェアを作る、前提を疑うための認知の視点 / doubt-premise
minodriven
21
6.6k
不変条件と整合性境界—ビジネスが決める設計判断と実現パターン / Invariants and Consistency Boundaries
nrslib
13
4.7k
Strategic Design in the Frontend: Moduliths & Micro Frontends @DDDEurope
manfredsteyer
PRO
0
100
New "Type" system on PicoRuby
pocke
1
930
Even G2とAWSで推しのエージェントを召喚しよう!
har1101
1
110
3Dシーンの圧縮
fadis
1
770
AIだと陥りがちなJakarta EE最新技術への移行時の落とし穴と解決策
tnagao7
0
110
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
270
A Modern Web Designer's Workflow
chriscoyier
698
190k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
130
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.4k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
330
RailsConf 2023
tenderlove
30
1.5k
The Curious Case for Waylosing
cassininazir
1
390
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
56k
Optimising Largest Contentful Paint
csswizardry
37
3.7k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
610
Transcript
Amazon Sagemaker Jump Startを用いて爆速でモデル を作成してみる🚀 2025.03.13 ©BLUEISH 2025. All rights
reserved.
立野 祐太 Yuta Tateno WEB開発(Go、GCP) 画像認識やRAGを用いた開発 WEBエンジニア 自己紹介 ©BLUEISH 2024.
All rights reserved.
ゴール Amazon Sagemaker Jump Startを用いたモデル作成方法を共有し、簡単に爆速でモ デルが作れるイメージを掴んでもらうこと
Amazon Sagemaker Jump Start とは? 機械学習のスターターキット 主な機能 ❏ 事前学習済みモデルの利用 :
すぐに使える AI モデルが多数用意 ❏ 簡単なカスタマイズ : ファインチューニング可能 ❏ 簡単なデプロイ : ボタン数クリックか SDK で本番環境に展開ができる ❏ モデル比較 : 品質や責任に関する指標でモデルを比較・選択ができる ❏ 組織内共有 : チーム内でモデルやノートブックを共有ができる
人物画像を入力することで年齢推定できるモデルを作成する さっそくやってみましょう! 🚀
Sagemaker Studioにアクセス
Jump Start 学習済みのモデルを利用できる
モデル選定 用途: 画像認識を用いた年齢推定
モデル選定
モデル選定 EfficientNet-B3を選択
モデル選定
モデルの検証 デプロイをし、素のモデル出力を確認する
モデルの検証 顔画像を入力し、モデル出力を確認 期待値 : 24 モデルの予測 : jersey モデルの予測 (上位5):
jersey, window shade, Band Aid, sunscreen, bulletproof vest 👉ファインチューニングを行い年齢推定 モデルにしていく
1. 人物画像と年齢のデータセットを収集 2. データセットをラベリング(前処理) 3. ファインチューニングを行う 4. デプロイ 5. モデルを検証
ファインチューニングの流れ
https://susanqq.github.io/UTKFace/ 人物の画像と年齢のデータセットを収集 UTKFaceで1~110歳までの学習データを約1万 枚 データセットの準備
データセットの前処理 ラベリング方法についてモデルページを確認 ディレクトリ名: 正解ラベル、ディレクトリの中: 学習用データとなるようにする
データセットのアップロード S3に前処理したデータセットをアップロード
ファインチューニング
ファインチューニング 1. S3にアップロードしたデータセット の選択 2. ハイパーパラメータの設定など行 う(今回はデフォルト)
ファインチューニング 1万枚のデータに対して約10分で完了(インスタンス:ml.p3.2xlarge) デプロイをしてモデルを検証
モデルの検証 顔画像を入力し、モデル出力を確認 期待値 : 24 モデルの予測 : 14 モデルの予測 (上位5):
14,52,26,27,29 正解はしなかったが、年齢推定モデルを 開発することができた 🚀
モデルの検証 正解はしなかったが、年齢推定モデルを開発することができた 🚀 アジア人のデータセットの学習量を増やす、より適切・高精度なモデル・アルゴリズムを 選択することで精度向上を望めそう!
まとめ 🔰 非エンジニアでもモデルを簡単に作成することが可能 🧠 適切なモデル選定、適切なデータセットがあれば精度向上可能 🚀 学習時間約10分、トータルでも約数十分で爆速開発可能だった (データセットのアップロード時間除く)