Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Creative as Software Engineering
Search
shibuiwilliam
January 18, 2024
Technology
2
590
Creative as Software Engineering
2024/01/18 生成AI MLOps LT大会の資料です。
https://mlops.connpass.com/event/305093/
shibuiwilliam
January 18, 2024
Tweet
Share
More Decks by shibuiwilliam
See All by shibuiwilliam
生成AIのためのデータ収集とデータエンジニアリング
shibuiwilliam
3
270
LLMで推論するライブラリを整理する
shibuiwilliam
5
820
生成AIの研究開発を事業につなげる データ、仕組み、コミュニケーション
shibuiwilliam
1
45
デプロイして本番システムで使うことから考えるAI
shibuiwilliam
1
450
今日からRAGを 始めることを考える
shibuiwilliam
2
1.5k
2024年生成AI新年会登壇資料
shibuiwilliam
0
270
Kubernetesクラスターを引き継ぐ技術
shibuiwilliam
3
280
機械学習システム構築実践ガイド
shibuiwilliam
1
820
GPT, Langchain, Faiss, FastAPIを組み合わせた Chat検索システム開発
shibuiwilliam
4
4.3k
Other Decks in Technology
See All in Technology
20241015 Toranomon Tech Hub#1 Service Catalog使ってみた
hiashisan
0
210
運営11年目タイトルを守る最強の盾の有効性と活用法
mixi_engineers
PRO
2
120
サーバレスで挑む IoT プロジェクトの現実解 / Real solutions for the IoT project using serverless service
genkiogasawara
1
110
不要なリソースを自動で定期的に整理する方法 ~Sandboxアカウントのコストを削減しよう!~
amixedcolor
4
220
データ分析基盤のためにS3を深堀りする~アーキテクチャ設計の考え方のヒントに~
nrinetcom
PRO
1
740
フェンリルの SwiftUI の研修を覗いてみる / Fenrir SwiftUI Training
studio_rookery
0
130
全社を巻き込んだ業務オペレーション改善と、それは事業成長に貢献しているのか?を実感した話
marroooon
0
130
テストを楽に書きたい
tomorrowkey
2
260
Cosmos DB で持続可能な RAG を実現しよう!~ AOAI Dev Day ふりかえりを添えて / Sustainable RAG with Cosmos DB with recap AOAI Dev Day
miyake
0
170
塩野義製薬様のAWS統合管理戦略:Organizations設計と運用の具体例
tkikuchi
0
300
自然言語処理を役立てるのはなぜ難しいのか
pfn
PRO
14
4.2k
RDS for Db2 データ移行編 - Part2:S3経由のバックアップ・リストアでデータ移行 /20241011-RDSforDb2-dojo
mayumihirano
0
140
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
PRO
28
7.6k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
92
16k
Automating Front-end Workflow
addyosmani
1365
200k
How to Ace a Technical Interview
jacobian
275
23k
jQuery: Nuts, Bolts and Bling
dougneiner
61
7.5k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
13
1.8k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
27
1.9k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
131
33k
Thoughts on Productivity
jonyablonski
67
4.3k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.4k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
4
250
Statistics for Hackers
jakevdp
796
220k
Transcript
Creative as Software Engineering 2024/01/18 Shibui Yusuke
本発表は個人の見解に基づくものであり、所 属組織を代表するものではありません。
自己紹介 shibui yusuke • 文学修士→いろいろ → Stability AI Japan •
主にデータエンジニア • もともとクラウド基盤の開発、運用 • ここ7年くらいMLOpsとバックエンドとインフラとデータ関 連で仕事 • Github: @shibuiwilliam • FB: yusuke.shibui • 最近の趣味:ルービックキューブ cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知 3
• 発売中! • https://www.amazon.co.jp/dp/4798173401/ • https://github.com/shibuiwilliam/building-ml-system • 発売中! • https://www.amazon.co.jp/dp/4798169447/
技術評論社Software & Designで MLOpsについて連載中! • 2023年8月号 MLOpsの概要 • 2023年9月号 MLOpsのためのスキルセットとチーム構成
• 2023年10月号 方針策定とMLOpsのためのツール • 2023年11月号 MLOpsのための技術選定 • 2023年12月号 LLMのためのDevOps • 2024年1月号 MLOpsと評価 • 2024年2月号 推論システム(予定) • 2024年3月号 機械学習システムの引き継ぎ(予定) MLOpsについてあまり他では取り上げられないテーマを 中心に記事を書いています!
これは何を作ってるでしょう? データを 用意 モデル選定 パラメータ 調整 パイプライン 実行 評価
答え:AIによるアニメ製作 データを 用意 モデル選定 パラメータ 調整 パイプライン 実行 評価 Stable
Diffusion Control Net VAE IPAdapter … プロンプト 乱数シード 時間調整 サンプラー スケジューラ … ComfyUI
本日は動画編集もアートも素人の私が 生成AIでコンテンツ製作する システムやワークフローを ソフトウェアエンジニアリングの観点から 検討していきます。
要素分解する Diffusion model + Control net + プロンプト + パラメータ
Diffusion model + Control net + プロンプト + パラメータ + コマ割り ラフ画をカラー画に変換 絵コンテの間を埋める
用意するもの: 最初の線画+パラメータ+プロンプト+パイプライン +GPU!!! Diffusion model + Control net + プロンプト
+ パラメータ Diffusion model + Control net + プロンプト + パラメータ + コマ割り ラフ画をカラー画に変換 絵コンテの間を埋める
開発環境は一般的なML開発と同じ ComfyUI ComfyUI カスタムノード モデル コンテンツ 100GBくらい使う。 Colab Pro+(月額5,767JPY)で A100を30時間/月くらい使える。
プロンプト(≒ストーリー)の変更で 違うコンテンツを量産できる 赤い目の 白い猫 青い目の 茶色い猫 春夏秋冬 子猫が成猫に成長 春夏秋冬 子猫が成猫に成長
人間に変身 所要時間:5分
構造的に考える テーマ 媒体 表現方法 公開 需要者 ビジネス 表現者 (チーム) 製作
事業化 コンテンツ 絵画 動画 音楽 テキスト ゲーム・・・ モナリザ 第九 吾輩は猫である ドラクエ・・・ 印象派 アニメ 雅楽・・・ 美術館 広告 投稿サイト コンサート SNS・・・ 購入 フリーミアム サブスク パトロン・・・
Creative as Software Engineering 関数 入力 出力
Creative as Software Engineering 生成AI 入力 出力 線画 プロンプト パラメータ
Embedding・・・ Diffusion Model Control Net Lora LLM・・・ 画像 動画 テキスト Embedding・・・
Creative as Software Engineering 生成AI Diffusion Model Control Net VAE・・・
赤い目の白い猫 Seed: 123 Sampler: DPMPP_2M Scheduler: Karras Steps: 20 … LLM 組み合わせ 最適化 評価 AIでフィルタリング 人間が選定 人間 修正、拡張
Creative as Software Engineering 生成AI & 人間 間を埋める 音楽を挿入する デザインを合わせる
個々に生成したシーン
Creative as Software Engineering Creative パイプライン 開発 ワークフロー マネジャー GPUクラスター
CI/CD ML パイプライン 基盤モデル + Lora 生成AI API LLM 人間 コンテンツ データ基盤 モデル 管理 公開 コスト たぶんこんな感じの構成?
まとめ • 生成AIによる新しいCreativeのワークフロー化、ソフトウェア化。 • ソフトウェアによってコンテンツを大量生産できるからこそDevOps的な課題が発生する。 • 大量・大容量のマルチモーダルな非構造化データを効率的に整理、管理、評価する仕組みが必要。 • 今日書ききれなかったこと: ◦
消費時間 > 生成時間へ ◦ 1アニメ : *視聴者から1アニメ : 1視聴者によるパーソナライゼーション 「俺たちの挑戦はこれからだ!」 というプロンプトで生成。
生成AIで一緒に世界を変えましょう! 絶賛採用中! https://stability.ai/careers X (旧Twitter) Stability AI (日本語): @StabilityAI_JP