Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
Search
画像センシングシンポジウム
PRO
June 12, 2024
Research
3
2.5k
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
画像センシングシンポジウム
PRO
June 12, 2024
Tweet
Share
More Decks by 画像センシングシンポジウム
See All by 画像センシングシンポジウム
SSII2024 [OS1] 自動運転における 重要技術とトレンド紹介
ssii
PRO
0
1k
SSII2024 [PD] SSIIアナザーストーリーズ
ssii
PRO
0
270
SSII2024 [OS1] 現場の課題を解決する ロボットラーニング
ssii
PRO
0
800
SSII2024 [OS1] 画像認識におけるモデル・データの共進化
ssii
PRO
0
790
SSII2024 [OS1] 研究紹介100連発(オープンニング)
ssii
PRO
0
640
SSII2024 [OS2] 大規模言語モデルと基盤モデルの射程
ssii
PRO
0
660
SSII2024 [OS2] 画像、その先へ 〜モーション解析への誘い〜
ssii
PRO
1
1.4k
SSII2024 [OS2] 大規模言語モデルとVision & Languageのこれから
ssii
PRO
5
1.6k
SSII2024 [OS2] GPT-4Vで画像認識は終わるのか(オープニング)
ssii
PRO
0
960
Other Decks in Research
See All in Research
資産間の相関関係を頑健に評価する指標を用いたファクターアローケーション戦略の構築
nomamist
0
190
Remote Sensing Vision-Language Foundation Models without Annotations via Ground Remote Alignment
satai
3
380
Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping
satai
3
280
Scale-Aware Recognition in Satellite images Under Resource Constraints
satai
3
170
EarthMarker: A Visual Prompting Multimodal Large Language Model for Remote Sensing
satai
3
170
Collaborative Development of Foundation Models at Japanese Academia
odashi
2
520
Vision Language Modelと完全自動運転AIの最新動向
tsubasashi
2
370
NLP2025参加報告会 LT資料
hargon24
1
280
한국어 오픈소스 거대 언어 모델의 가능성: 새로운 시대의 언어 이해와 생성
inureyes
PRO
0
300
DPUを用いたマルチタスクDNN表情認識システムのFPGA実装
takuto_andtt
0
140
SpectralMamba: Efficient Mamba for Hyperspectral Image Classification
satai
3
300
eAI (Engineerable AI) プロジェクトの全体像 / Overview of eAI Project
ishikawafyu
0
440
Featured
See All Featured
Into the Great Unknown - MozCon
thekraken
37
1.7k
Adopting Sorbet at Scale
ufuk
76
9.3k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
178
53k
For a Future-Friendly Web
brad_frost
176
9.7k
A designer walks into a library…
pauljervisheath
205
24k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Designing for humans not robots
tammielis
252
25k
How STYLIGHT went responsive
nonsquared
99
5.5k
How to train your dragon (web standard)
notwaldorf
90
6k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.4k
Unsuck your backbone
ammeep
670
57k
StorybookのUI Testing Handbookを読んだ
zakiyama
29
5.6k
Transcript
画像生成技術の発展: 過去10年の軌跡と未来への展望 2024.6.12 石井 雅人(Sony Research Inc.)
None
None
None
None
None
None
None
None
None
None
None
None
𝑝(𝑧)
𝑝(𝑧)
None
None
None
⇒
None
None
None
None
None
None
None
None
𝑥𝑇 𝑥𝑡−1 𝑥𝑡 𝑥0 𝑝𝜃 (𝑥𝑡−1 |𝑥𝑡 ) 𝑞(𝑥𝑡 |𝑥𝑡−1
)
× 𝑇 × 𝑇 × 𝑇
𝑥𝑡0−1 𝑥𝑡0 𝑥0 𝑥𝑇 𝑡0
None
None
None
… … … … … … 𝑧𝑑+1:𝐷 𝑧1:𝑑 𝑧 𝑧1:𝑑
′ 𝑧𝑑+1:𝐷 ′ 𝑧′ 𝑧′ = 𝑧1:𝑑 , 𝑧𝑑+1:𝐷 + 𝑔 𝑧1:𝑑 𝑔(𝑧1:𝑑 ) 𝑧 = 𝑧1:𝑑 ′ , 𝑧𝑑+1:𝐷 ′ − 𝑔 𝑧1:𝑑 ′
𝐳𝑡+1 = 𝐳𝑡 + 𝑓𝑡 (𝐳𝑡 ) d𝐳(𝑡) d𝑡 =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳 𝑡 𝑓0 𝑓1 𝑓𝑇
𝐳 𝑡 𝐳 𝑡
𝐳 𝑡
None
𝐳 𝑡 𝐳 𝑡
d𝐳(𝑡) d𝑡 = 𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳(1) =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡
None
None
•