Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
Search
画像センシングシンポジウム
PRO
June 12, 2024
Research
3
2.1k
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
画像センシングシンポジウム
PRO
June 12, 2024
Tweet
Share
More Decks by 画像センシングシンポジウム
See All by 画像センシングシンポジウム
SSII2024 [OS1] 自動運転における 重要技術とトレンド紹介
ssii
PRO
0
730
SSII2024 [PD] SSIIアナザーストーリーズ
ssii
PRO
0
210
SSII2024 [OS1] 現場の課題を解決する ロボットラーニング
ssii
PRO
0
630
SSII2024 [OS1] 画像認識におけるモデル・データの共進化
ssii
PRO
0
530
SSII2024 [OS1] 研究紹介100連発(オープンニング)
ssii
PRO
0
520
SSII2024 [OS2] 大規模言語モデルと基盤モデルの射程
ssii
PRO
0
520
SSII2024 [OS2] 画像、その先へ 〜モーション解析への誘い〜
ssii
PRO
1
1.2k
SSII2024 [OS2] 大規模言語モデルとVision & Languageのこれから
ssii
PRO
5
1.5k
SSII2024 [OS2] GPT-4Vで画像認識は終わるのか(オープニング)
ssii
PRO
0
820
Other Decks in Research
See All in Research
システムから変える 自分と世界を変えるシステムチェンジの方法論 / Systems Change Approaches
dmattsun
3
850
第60回名古屋CV・PRMU勉強会:CVPR2024論文紹介(Vision Transformer)
waka_90b
1
200
いしかわ暮らしセミナー~移住にまつわるお金の話~
matyuda
0
140
Practical The One Person Framework
asonas
1
1.6k
Matching 2D Images in 3D: Metric Relative Pose from Metric Correspondences
sgk
1
310
日本語医療LLM評価ベンチマークの構築と性能分析
fta98
3
590
秘伝:脆弱性診断をうまく活用してセキュリティを確保するには
okdt
PRO
3
730
クロスセクター効果研究会 熊本都市交通リノベーション~「車1割削減、渋滞半減、公共交通2倍」の実現へ~
trafficbrain
0
110
JMED-LLM: 日本語医療LLM評価データセットの公開
fta98
5
1.2k
Kaggle役立ちアイテム紹介(入門編)
k951286
13
4.5k
SNLP2024:Planning Like Human: A Dual-process Framework for Dialogue Planning
yukizenimoto
1
320
3次元点群の分類における評価指標について
kentaitakura
0
390
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.2k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5k
The Cost Of JavaScript in 2023
addyosmani
45
6.6k
How GitHub (no longer) Works
holman
310
140k
Building Adaptive Systems
keathley
38
2.3k
Code Review Best Practice
trishagee
64
17k
Building an army of robots
kneath
302
42k
Git: the NoSQL Database
bkeepers
PRO
427
64k
Fontdeck: Realign not Redesign
paulrobertlloyd
82
5.2k
Optimising Largest Contentful Paint
csswizardry
33
2.9k
Teambox: Starting and Learning
jrom
133
8.8k
Transcript
画像生成技術の発展: 過去10年の軌跡と未来への展望 2024.6.12 石井 雅人(Sony Research Inc.)
None
None
None
None
None
None
None
None
None
None
None
None
𝑝(𝑧)
𝑝(𝑧)
None
None
None
⇒
None
None
None
None
None
None
None
None
𝑥𝑇 𝑥𝑡−1 𝑥𝑡 𝑥0 𝑝𝜃 (𝑥𝑡−1 |𝑥𝑡 ) 𝑞(𝑥𝑡 |𝑥𝑡−1
)
× 𝑇 × 𝑇 × 𝑇
𝑥𝑡0−1 𝑥𝑡0 𝑥0 𝑥𝑇 𝑡0
None
None
None
… … … … … … 𝑧𝑑+1:𝐷 𝑧1:𝑑 𝑧 𝑧1:𝑑
′ 𝑧𝑑+1:𝐷 ′ 𝑧′ 𝑧′ = 𝑧1:𝑑 , 𝑧𝑑+1:𝐷 + 𝑔 𝑧1:𝑑 𝑔(𝑧1:𝑑 ) 𝑧 = 𝑧1:𝑑 ′ , 𝑧𝑑+1:𝐷 ′ − 𝑔 𝑧1:𝑑 ′
𝐳𝑡+1 = 𝐳𝑡 + 𝑓𝑡 (𝐳𝑡 ) d𝐳(𝑡) d𝑡 =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳 𝑡 𝑓0 𝑓1 𝑓𝑇
𝐳 𝑡 𝐳 𝑡
𝐳 𝑡
None
𝐳 𝑡 𝐳 𝑡
d𝐳(𝑡) d𝑡 = 𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳(1) =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡
None
None
•