Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Stable Diffusion楽しいぞい というお気持ちの共有
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
hoda
September 16, 2023
Technology
270
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Stable Diffusion楽しいぞい というお気持ちの共有
社内のLT会で共有した資料
hoda
September 16, 2023
More Decks by hoda
See All by hoda
なぜ私はVimを使うことになったのか
hodanov
2
660
ReactとPython/Djangoで何か作りたい
hodanov
1
730
Docker入門ハンズオン.pdf
hodanov
6
2.5k
Other Decks in Technology
See All in Technology
スタートアップにAmazon EKSは早すぎる? マルチプロダクト戦略を加速する Platform Engineeringの実践 / Is Amazon EKS Too Soon for Startups? Practical Platform Engineering to Accelerate a Multi-Product Strategy
elmodev09
1
1.8k
【2026年版】 ベクトル検索とEmbedding最前線
mocobeta
23
7.5k
AI時代のコスト管理を考えよう〜明日から使える実践AWSノウハウ~
yoshimi0227
0
860
Comment regagner la souveraineté de vos données tout en étant payé grâce à Nostr !
rlifchitz
0
200
[AWS Summit Japan 2026]迷っているあなたへ_小さな一歩が、やがて自分を助けてくれる
sh_fk2
2
410
時期が悪い!それでもRaspberry Piを買って遊んで活用するには / 20260627-osc26do-rpi-jikigawarui
akkiesoft
0
800
気軽に使える"情報のハブ"としてのNotion活用 〜フロー情報の集積点 と、 Claude Code × Notion AI〜
syucream
1
190
AI Agentをシステムに組み込む前にゆるく向き合ってみる
hayama17
0
130
自分が詳しくない領域でAIを使う #プロヒス2026
konifar
20
7.4k
“詰む”前に仕組みを作れ 〜技術の波に溺れないためのキャッチアップ術〜
takasyou
7
3.8k
Lightning近況報告
kozy4324
0
220
クレデンシャル流出 ― 攻撃 3 時間 vs 復旧 10 時間。この非対称性にどう備えるか
kazzpapa3
3
560
Featured
See All Featured
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
400
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.3k
Unsuck your backbone
ammeep
672
58k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Chasing Engaging Ingredients in Design
codingconduct
0
230
The Curious Case for Waylosing
cassininazir
1
400
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
870
The agentic SEO stack - context over prompts
schlessera
0
820
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
370
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
Agile that works and the tools we love
rasmusluckow
331
22k
Building Adaptive Systems
keathley
44
3.1k
Transcript
Stable Diffusion楽しいぞい というお気持ちの共有
自己紹介 • カスタマーサポート部を技術で支援するチームのBEエンジニア ◦ ヘルプ管理、お問い合わせ管理システムの新規開発、新規機能の実装など。 • およそ2年にわたる大規模開発/改修が終わってホッとしている。 • 休息も束の間、また大規模なリファクタが控え、新機能の実装なども進行中なの で、引き続き頑張りたい。
ChatGPTの盛り上がりを受けて、生成AIを触る機運が高まる ChatGPTすごいな、、 Whisperの文字起こしもすごい、、 そういえば、画像生成できるAIもあったな、、 触ってみるか 背景
背景 さっそくStable Diffusion WebUIを試す →人物画像、風景画像などがボタンぽち〜で作れて感動 だがしかしIntelコアのMacbook(2019年製) 500x500pxの画像を生成するのに10min以上かかる
背景 自分のPCだとつらいので、クラウド基盤の利用を検討 MLOpsとまではいかずとも、 可搬性の高い実行環境(コンテナ)がほしい できればお金をかけずに遊びたい Docker GPU Portable CLIベース 無料
Scalable
背景 Modal: モデル推論、バッチ処理、タスクキュー、ウェブアプリケーションなどをクラウド上 で実行できるサービス • CLIベース(基本的に手元のPCのターミナルからの操作で完結する) • Dockerでコンテナライズしたアプリをデプロイ可能 • AWS
S3、ECRなどと連携が可能(無料で使いたかったので今回は不使用) • GitHub Actionの利用もOK • 30[$/月]まで無料(小さめの画像なら約50000枚生成可能) 2023/9/1時点では無料枠が10[$/月]に改定された模様😔
Modalを使ってStable Diffusionを動かしてみた コードを準備できたら、「modal deploy」コマンドを実行。 推論を実行するためのコードを元にコンテナ化し、一つのアプリケーションとして Modal上にデプロイ される。 *今回、PythonのDiffusersライブラリを使って実装。モデルは学習済みのものを利用。
Modalを使ってStable Diffusionを動かしてみた デプロイ後、命令(プロンプト)を出して画像出力
結果 - 高解像度(3072x2048px)の画像をほいほい作れるようになった。 - 生成速度(Nvidia A10G利用時): 500x500px: 5~6[s] 3072x2048px: 17~18[s]
Modalについての感想 - デプロイしたアプリケーションは破棄命令を出さない限り残り続けるのが良い( Google Colabだと一定時 間経過後に揮発する) - アプリケーションが待機している間はコストがかからないので、使いたいときにすぐ再開できる。 - CLIで操作を完結できるのがありがたい - 手元のPCでフォーマッター、リンターが効いた環境でコーディングしたコードをそのままデプロイできるの が良い(Google Colabは基本ブラウザベースなのでフォーマッター、リンターを使うのが難しい)
おわり • Stable Diffusionで遊びました!楽しかったです! • リポジトリのURLと詳細 https://github.com/hodanov/stable-diffusion-modal https://hodalog.com/running-stable-diffusion-cli-on-modal/