Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TorchServeからFastAPIにした話
Search
xthixsl_ml
December 11, 2025
36
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
TorchServeからFastAPIにした話
xthixsl_ml
December 11, 2025
More Decks by xthixsl_ml
See All by xthixsl_ml
State-Aware RAGをAmazon Bedrock とAmazon S3 Vectorsで再現してみた
xthixsl_ml
1
48
制限付きRAGを試してみた
xthixsl_ml
0
29
MLモデル実装にStrategy パターンを導入してみた
xthixsl_ml
0
120
Vibe ML Model Training, Tracking and Kaizen
xthixsl_ml
0
47
Strands Agents Evals SDK 試してみた ~ Experiment Generator編 ~
xthixsl_ml
0
42
全部をAIエージェントにしない設計: AWS Step Functions × Amazon Bedrock AgentCore × Strands Agents Multiagent Graphで不確実性を考慮するワークフロー
xthixsl_ml
0
220
BentoML使ってみた
xthixsl_ml
0
65
社内AIハッカソンでAmazon Bedrock AgentCore 使ってみた
xthixsl_ml
2
240
新卒エンジニアが挑む、AWS Knowledge MCP Serverを活用したキャッチアップ術
xthixsl_ml
0
70
Featured
See All Featured
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
290
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
380
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
2
570
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Site-Speed That Sticks
csswizardry
13
1.2k
Design in an AI World
tapps
1
240
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Fireside Chat
paigeccino
42
3.9k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
130
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
770
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
Transcript
©Fusic Co., Ltd. 0 TorchServeからFastAPIにした話 2025.12.12 佐藤 礼央奈 X: @xthixsl_ml
福岡Tech LT大忘年会
©Fusic Co., Ltd. 1 自己紹介 はじめに 佐藤 礼央奈 R E
O N A S AT O 株式会社Fusic エンジニア 東京の大学を卒業。在学中にエンジニアとして3社で約2年半の長期イン ターンを経験。機械学習や生成AIの研究開発に携わる中で、MLモデルの 本番運用に興味を持ちMLOpsに関心を深める。生成AIも取り入れた開発 や、AWSパートナー企業での経験から、同領域に強みを持つFusicに魅力 を感じ、2025年に新卒入社。
©Fusic Co., Ltd. 2 1. 背景 2. 対策
©Fusic Co., Ltd. 3 背景 1
©Fusic Co., Ltd. 4 1. 背景 サブタイトル SageMaker Docker Image
+ Endpoint NVIDIA NGC イメージ (nvcr.io) TorchServe がメンテ終了 & バージョン問題 FastAPI で自前実装 amd端末で推論コンテナ立ち上げ、追加でarm端末での 対応が必要に arm端末の制約、DLモデルの変更が発生、Pythonの バージョンをアップグレード 3.8から3.12へ Serve系のライブラリの検討 ※Serveとはモデルを推論APIとしてを提供することを指します
©Fusic Co., Ltd. 5 対策 2
©Fusic Co., Ltd. 6 2. 対策 サブタイトル • SageMakerのエンドポイント仕様に合わせている実装でした。 •
GET /ping - ヘルスチェック(コンテナが正常かどうか) • POST /invocations - 推論リクエストを受け付ける • Triton Inference Server → 高性能だが導入・運用が複雑 • BentoML → 便利だが追加の依存が増える • FastAPI → シンプル、依存が少ない → /ping と /invocations だけなら十分 TorchServe が Limited Maintenance になったので移行するサービングライブラリを検討した https://buildersbox.corp-sansan.com/entry/2025/03/26/100000 参照:
©Fusic Co., Ltd. 7 2. 対策 サブタイトル • SageMakerのエンドポイント仕様に合わせている実装でした。 •
GET /ping - ヘルスチェック(コンテナが正常かどうか) • POST /invocations - 推論リクエストを受け付ける • Triton Inference Server → 高性能だが導入・運用が複雑 • BentoML → 便利だが追加の依存が増える • FastAPI → シンプル、依存が少ない → /ping と /invocations だけなら十分 TorchServe が Limited Maintenance になったので移行するサービングライブラリを検討した https://buildersbox.corp-sansan.com/entry/2025/03/26/100000 参照: FastAPI 採用
©Fusic Co., Ltd. 8 Thank You We are Hiring! https://recruit.fusic.co.jp/
ご清聴いただきありがとうございました