Upgrade to Pro — share decks privately, control downloads, hide ads and more …

EarthSynth: Generating Informative Earth Observ...

EarthSynth: Generating Informative Earth Observation with Diffusion Models

本資料はSatAI.challengeのサーベイメンバーと共に作成したものです。
SatAI.challengeは、リモートセンシング技術にAIを適用した論文の調査や、より俯瞰した技術トレンドの調査や国際学会のメタサーベイを行う研究グループです。speakerdeckではSatAI.challenge内での勉強会で使用した資料をWeb上で共有しています。
https://x.com/sataichallenge
紹介する論文は、「EarthSynth: Generating Informative Earth Observation with Diffusion Models」です。
本研究では、ラベル付きリモートセンシング画像の不足という課題に対し、マルチカテゴリ・マルチソースに対応した拡張学習用データを生成するための拡散モデルベースの基盤モデル「EarthSynth」を提案しています。EarthSynthは、画像、セマンティックマスク、テキストプロンプトが整合した180Kサンプルから成るEarthSynth-180Kデータセットで訓練されており、シーン分類、物体検出、セマンティックセグメンテーションといった複数の下流タスクに対応可能です。
特に注目すべき点は、現実には存在しないが論理的には整合したシーンを生成する「Counterfactual Composition (CF-Comp)」戦略を採用し、レイアウトの制御性とカテゴリの多様性を両立させている点です。また、CLIPスコアに基づくルールベースのフィルタリング手法「R-Filter」を導入することで、タスクに有用な高品質な合成データのみを選別しています。

Avatar for SatAI.challenge

SatAI.challenge

June 03, 2025
Tweet

More Decks by SatAI.challenge

Other Decks in Research

Transcript

  1. 目次 
 2 • 自己紹介スライド
 • 研究の1ページサマリ紹介 
 • 研究の背景(Introduction)

    
 • 手法について(Method) 
 • 実験(Experimet)
 • 結論(Conclusion)

  2. 佐々木謙一 • 2012-2016:東工大機械宇宙学科 • 2016-2019:東工大院松永研究室 • 2019-2023:CU Boulder Aerospace Engineering

    Ph.D. in Remote Sensing, Marine pollution monitoring • Internship • 2023-2025: Esri, product engineer in spatial analysis team • 2025: Helios
  3. EarthSynth: Generating Informative Earth Observation with Diffusion Models
 6 •

    分類・検出・セグメンテーションを含む複数タスクに対応する生成モデルを構築 • CF-Comp(Counterfactual Composition):複数画像の物体と背景を論理的に再構成 • R-Filter: CLIPスコアを用いて高品質な合成データのみを選別 • 下流モデルの事前学習やデータ拡張として有効 
 EarthSynth: 拡散モデルを用いたタスク横断の合成画像生成手法 
 Jiancheng Pan et al. (2025),”EarthSynth: Generating Informative Earth Observation with Diffusion Models’, arXiv. より引用
  4. Remote sensing Image(RSI)の課題 • ラベル作成コスト高 • クラスの偏り (例:車や建物は多いがヘリポートは少ない) • タスクごとに別の合成モデルを使う非効率性

    生成モデルの役割 • 拡散モデルによる高品質データの合成 • データ多様性・一般化性能の向上 
 Introduction 
 8 Jiancheng Pan et al. (2025),”EarthSynth: Generating Informative Earth Observation with Diffusion Models’, arXiv. より引用
  5. 手法
 9 EarthSynthの概要
 • 条件付きDiffusion(テキスト + セマンティックマスク) • マルチソース・マルチカテゴリデータセット「EarthSynth-180K」を構築 •

    生成出力は画像・マスク・テキストのトリプレット 
 Jiancheng Pan et al. (2025),”EarthSynth: Generating Informative Earth Observation with Diffusion Models’, arXiv. より引用
  6. 手法
 10 EarthSynth
 1. データ収集 & EarthSynth-180Kの構築 • 公開データセットを統合:OEM、LoveDA、DeepGlobeなど •

    各画像に対して: ◦ セマンティックマスク(m) ◦ テキスト説明(t)を自動/半自動で生成 • 180,000件の (画像, マスク, テキスト) トリプレット 2. モデル学習 • Stable Diffusion v1.5をベースに再学習 • 条件付き入力:セマンティックマスク m, テキスト t • セマンティクス強化 ◦ CF-Comp(物体と背景の動的合成) ◦ Local/Global Lossによる空間制御 Jiancheng Pan et al. (2025),”EarthSynth: Generating Informative Earth Observation with Diffusion Models’, arXiv. より引用
  7. 手法
 11 EarthSynth
 3. サンプル生成(Inference) • 任意のマスク・テキストを入力すると、新規のRS画像 x を生成 •

    出力:x,m,t(画像・マスク・テキスト)のトリプレット • R-Filterによる品質チェック 4. 下流タスクへの応用 • Scene Classification:画像 + カテゴリラベル(テキストから抽出) • Object Detection:マスクからBBox抽出 • Semantic Segmentation:マスクをそのまま使用 Jiancheng Pan et al. (2025),”EarthSynth: Generating Informative Earth Observation with Diffusion Models’, arXiv. より引用
  8. 結果
 14 Downstream task
 
 分類:CLIP 検出:GroundingDINO セグメンテーション:GSNet 
 Jiancheng Pan

    et al. (2025),”EarthSynth: Generating Informative Earth Observation with Diffusion Models’, arXiv. より引用
  9. 結果
 15 Downstream task
 
 分類:CLIP 検出:GroundingDINO セグメンテーション:GSNet 
 Jiancheng Pan

    et al. (2025),”EarthSynth: Generating Informative Earth Observation with Diffusion Models’, arXiv. より引用
  10. Ablation study
 16 Key modules contribution
 - 最も良い条件 - 128

    samples/class - R-Filter: 1pt 向上 - CF-Comp: 1.4pt 向上 Jiancheng Pan et al. (2025),”EarthSynth: Generating Informative Earth Observation with Diffusion Models’, arXiv. より引用