Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
Search
画像センシングシンポジウム
PRO
June 12, 2024
Research
3.4k
8
Share
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
画像センシングシンポジウム
PRO
June 12, 2024
More Decks by 画像センシングシンポジウム
See All by 画像センシングシンポジウム
SSII2025 [OS3] どの論文でもダメなんだけど! 〜実応用とその課題〜
ssii
PRO
2
1.7k
SSII2025 [OS3-01] End-to-End自動運転の実応用の現場から
ssii
PRO
6
3.3k
SSII2025 [OS3-02] 広告における画像生成技術の実応用の現状
ssii
PRO
6
1.5k
SSII2025 [OS3-03] 有機ミニトマト農場におけるロボット開発と基礎研究
ssii
PRO
0
1.1k
SSII2025 [OS2-01] 自動運転の性能と共に進化するセンシングデバイス
ssii
PRO
2
2.1k
SSII2025 [TS3] 医工連携における画像情報学研究
ssii
PRO
3
1.5k
SSII2025 [OS2] 新たなセンシングの潮流
ssii
PRO
1
710
SSII2025 [OS2-02] イベントカメラの研究紹介と可視光通信への応用
ssii
PRO
1
1.4k
SSII2025 [OS2-03] マルチ/ハイパースペクトル領域における高度な画像撮影および処理技術
ssii
PRO
2
1.5k
Other Decks in Research
See All in Research
SREのためのテレメトリー技術の探究 / Telemetry for SRE
yuukit
13
3.4k
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
1k
オーストリア流 都市の公共交通サービス水準評価@公共交通オープンデータ最前線2026
trafficbrain
0
110
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
140
空間音響処理における物理法則に基づく機械学習
skoyamalab
0
260
それ、チームの改善になってますか?ー「チームとは?」から始めた組織の実験ー
hirakawa51
0
1k
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
0
120
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
310
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
190
Unified Audio Source Separation (Defense Slides)
kohei_1979
1
550
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
110
Grounding Text Complexity Control in Defined Linguistic Difficulty [Keynote@*SEM2025]
yukiar
0
140
Featured
See All Featured
Being A Developer After 40
akosma
91
590k
The Curse of the Amulet
leimatthew05
1
11k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
150
Git: the NoSQL Database
bkeepers
PRO
432
67k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
230
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
160
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.1k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
A Modern Web Designer's Workflow
chriscoyier
698
190k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
GraphQLとの向き合い方2022年版
quramy
50
14k
Transcript
画像生成技術の発展: 過去10年の軌跡と未来への展望 2024.6.12 石井 雅人(Sony Research Inc.)
None
None
None
None
None
None
None
None
None
None
None
None
𝑝(𝑧)
𝑝(𝑧)
None
None
None
⇒
None
None
None
None
None
None
None
None
𝑥𝑇 𝑥𝑡−1 𝑥𝑡 𝑥0 𝑝𝜃 (𝑥𝑡−1 |𝑥𝑡 ) 𝑞(𝑥𝑡 |𝑥𝑡−1
)
× 𝑇 × 𝑇 × 𝑇
𝑥𝑡0−1 𝑥𝑡0 𝑥0 𝑥𝑇 𝑡0
None
None
None
… … … … … … 𝑧𝑑+1:𝐷 𝑧1:𝑑 𝑧 𝑧1:𝑑
′ 𝑧𝑑+1:𝐷 ′ 𝑧′ 𝑧′ = 𝑧1:𝑑 , 𝑧𝑑+1:𝐷 + 𝑔 𝑧1:𝑑 𝑔(𝑧1:𝑑 ) 𝑧 = 𝑧1:𝑑 ′ , 𝑧𝑑+1:𝐷 ′ − 𝑔 𝑧1:𝑑 ′
𝐳𝑡+1 = 𝐳𝑡 + 𝑓𝑡 (𝐳𝑡 ) d𝐳(𝑡) d𝑡 =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳 𝑡 𝑓0 𝑓1 𝑓𝑇
𝐳 𝑡 𝐳 𝑡
𝐳 𝑡
None
𝐳 𝑡 𝐳 𝑡
d𝐳(𝑡) d𝑡 = 𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳(1) =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡
None
None
•