AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data

中村凌・篠原崇之・青木亮祐  藤野倫太郎・平出尚義・嶌田将貴  1 第16回 atAI.challenge勉強会  AlphaEarth Foundations: An embedding field
model for accurate and efficient global mapping from sparse label data

中村凌株式会社天地人 / SatAI.challenge 主宰 / cvpaper.challenge HQ •
株式会社天地人データサイエンティスト（2024/04 - 現在） • SatAI.challenge 主宰（2024/09 - 現在） • cvpaper.challenge HQ（2021/1 - 現在） • 福岡大学大学院理学研究科応用数学専攻博士課程（2021/04 - 2024/03） • 産業技術総合研究所コンピュータビジョンチーム RA（2021/05 - 2024/03） • 福岡大学大学院理学研究科応用数学専攻修士課程（2019/04 - 2021/03）自己紹介 Twitter LinkedIn 2 これまで個人的な活動 • 研究効率化Tips （ViEW2021招待講演） • 国際会議へ論文採択実績（IROS / ICCV 2023, ICASSP / ECCV2024） • CCCS,W2021/2022 GC PC（登録者800名超え） • SSII2023オーディエンス賞受賞 • SatAI.challenge運営（国際論文日本語資料・動画アーカイブ化）

自己紹介   3 研究テーマ：３次元モデリング、サロゲートモデル、動的システム、土木インフラ 3 X(旧 Twitter) LinkedIn 産総研
- サロゲートモデル: 制御x深層学習モデル - 土木インフラxAI: インフラ劣化予測篠原崇之

4 自己紹介  平出尚義 (ひらでなおよし)     ・一般財団法人リモート・センシング技術センター
( E EC)   ・筑波大学大学院　博士課程後期1年生 (2025/04 -, 社会人D)     - 国/地域レベルで土地利用土地被覆分類   - 衛星校正検証 (ラジオメトリック / ジオメトリック)   - 衛星データ×AI系 (抽出、分類、超解像、基盤モデル)   土地利用土地被覆図作成   校正検証業務 (現地測量)  

藤野倫太郎東京理科大学大学院　創域理工学専攻　社会基盤工学研究科　修士1年　 - 東京理科大学　水理研究室所属　　- AcademiX(AIを学びたい学生が集まるコミュニティ) 運営メンバー　　-
未踏アドバンス(2023) 野球動作解析アプリ開発研究テーマ：河川橋梁洗掘(実験・混相流数値計算) 5 興味ある分野：数値計算　　　　　　　　人工知能全般(距離学習、GNN、サロゲートモデル) リモートセンシング自己紹介

青木亮祐（ぴっかりん） • 株式会社パスコ研究開発センター ◦ 地理空間情報×AIで色々行ったり、そ環境整備 • Project
PLATEAU ADVOCATE 2025 • 一般社団法人OSGeo日本支部( OSGeo.JP ) 運営委員自己紹介 6 X（旧Twitter） GitHub 過去に個人で行った衛星データ関連発表  個人開発したPLA EA API MCPサーバー 

嶌田　将貴（シマダ　ショウキ） • JAXA地球観測研究センター（EORC） • 専門地球観測衛星データ解析による環境変化定量化や、農業など食料分野における情報整備
自己紹介 7 衛星画像から検出した太陽光発電パネル  時系列画像から分析した作付けマップ 

異なるモダリティ・時間データ地理空間表現を埋め込むため方法紹介と性能紹介   埋め込みベクトルデータセットも公開予定   8 AlphaEarth
Foundations: An embedding field model for accurate and efficient global mapping from sparse label data   • 地球観測データ大量に収集されているが、測定と観測に膨大な労力がかかるため、高品質なラベル依然として不足（まらなラベルを地図に変換するため特注モデリングへ投資が盛ん）   • 複数情報源にまたがる空間的、時間的、および測定コンテキストを同化する、非常に汎用的な地理空間表現を生み出す埋め込みフィールドモデルであるAlphaEarth Foundationsを紹介   • AlphaEarth Foundationsによって生成される埋め込み、再トレーニングなしで多様なマッピング評価セットでテストされた、これまですべて特徴量化アプローチを一貫して上回る性能であった   • 2017年から2024年まで、地球規模年間分析可能な埋め込みフィールドレイヤーデータセットを公開する予定   Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

背景　  • 数十年で地球観測（EO）データ広く利用可能になり、現在、地球生態系と気候過去、現在、未来に関する問いに答えるために用いられてきた   • 地球観測（EO）データ
世界中で継続的に収集されており、食料供給や災害対応といった地球規模課題管理に不可欠となっている   従来手法・課題　  • 正確な測定データやラベルが不足しているという問題がある  • ハンドクラフト EO特徴設計限界（ND I等植生指数、ベストピクセル合成など）地図化で広く有効だが、ノイズやセンサー依存、地域・用途に応じて人手で作業するコストが高い   • マルチソース／モダリティ・時間情報取り込み・運用可能な高解像度という要件を同時に満たせ無いという問題：機械学習／基盤モデル（ atMAE系や atCLIPなど）進展しているが、条件が揃わないと少量ラベル条件で学習特徴が手設計特徴に必ずしも勝てない   Introduction   これら課題を解決するため、普遍的な特徴空間を生成する地理空間埋め込み基盤モデルを提案   ➢ 様々な応用分野で既存ど手法よりも一貫して優れた性能を示す  ➢ これまで支配的な手法がなかった状況から大きな進歩となる Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

• AlphaEarth Foundationsと衛星（ entinel-1/2・Landsat 8/9）など複数ソース・空間・時間までを一つ特徴量で表現する“埋め込みフィールド（embedding field）”モデル  
◦ 10×10mにリサンプリングした時系列マルチモダリティデータを64次元ベクトルに埋め込むモデル  • 埋め込みベクトル計算に   ◦ 画像再構成誤差最適化 (以下画像B 部分に相当)   ◦ バッチ均一性目的 (Batch uniformity objective):   ◦ ◦ エンベディング空間利用率を高め、エンベディングベクトルが64次元単位球面上に均一に分布するように促します  ◦ Consistency objective ：クリーンなデータを使う教師モデル埋込みとノイズを含んだ生徒モデルが出力する埋込みベクトルが一致するように学習。急なノイズにロバストになる。（図E）   ◦ ext contrastive objective ：言語と CLIP学習をすることで言語空間セマンティクスを獲得   AlphaEarth Foundationsについて   10 Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

実験: 評価手法(Evaluation in realistic data-scarce scenarios)   11 • 評価
狙い  ◦ 実務で求められる「ピクセル単位地図化」を、ごく少数ラベル（数十〜数百）でも成立させられるかを評価  ◦ 既存ベンチ物体／画像レベル教師が空間的に限定している場合が多く、実運用評価に不十分ため幅広いデータセットで評価   • タスク  ◦ 11 公開データセットから計15課題を作成（L LC・土地利用変化・作物種別・樹種属・蒸発散量・放射率など）  ◦ クラスごとにバランス良く少数サンプルを抽出し、残りテストへ   ◦ サンプル点 1.28 km 以上間隔を確保   ◦ 試行 1-shot／10-shot／最大試行 3条件 ← ここがよくわからない   ◦ 埋め込み特徴量評価 kNN と線形層といった最小限学習器で評価。   ◦ 指標分類＝Balanced Accuracy、回帰＝ ²。   • 比較対象（ベースライン）   ◦ 設計特徴量：CCDC, MO AIK (Multi-task Observation using atellite Imagery & Kitchen inks), composites  ◦ 学習済み既存基盤モデル特徴量： atCLIP, Prithvi, Clay   ◦ そほか手法： , （緯度経度・標高）, ImageNet 事前学習 i 。   ◦ 入力可能な限り同一にし、各手法ハイパラも最適化。   Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

実験: タスク・データ紹介   12 Christopher F. Brown et al.
(2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用 • タスク一覧   分類タスク：  　土地利用土地被覆分類、変化   　作物、樹種分類     回帰タスク：  　物理量推定 (蒸発散量、地表放射率回帰)   　　※OpenE Evapo ranspiration, 地表から大気へ失われる水総量   　　  • データ一覧  ◦ Optical： entinel-2/、Landsat 8/9   ◦ adar： entinel-1、ALO -2/PAL A -2 ( can A )   ◦ LiDA ：GEDI aster Canopy Height metrics   ◦ Environmental：GLO-30 DEM、E A5-Land、G ACE（重力ポテンシャル）   ◦ Annotated：NLCD、 ikipedia（地理タグ付きテキスト）   ◦ → 合計 9 種グリッドデータ＋1 種非構造テキスト、30億超観測（地上面積約 1.1% を網羅）  

実験: 結果( hematic mapping)   13 • 土地利用/土地被覆/作物検出/作物種別/樹種分布を評価   ◦
AEF (AlphaEarth Foundations) 埋め込み特徴量を使って、単純な線形分類器などで分類を行う   ◦ 年ごとで集約された課題（LCMAP land cover / land use、Africa crop mask、油ヤシなど）で最大誤差低減を達成  ▪ ほぼ全タスクで誤差削減（Ethiopia crops を除く）。   ◦ 多様なデータセットにわたり一貫して高性能で、高次元埋め込みでも得られなかった汎用性を示した。   カナダ作物分類タスク  黒点線分類タスク  におけるランダム当て基準  Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

実験: 結果 (Estimating biophysical variables)   14 • 上空画像から直接観測しにくい量（地表放射率（emissivity）、蒸発散（E ））を回帰タスクで評価
  ◦ 放射率：ほとんどベースラインがある程度推定可能だったが、AEFが最高推定性能   ◦ 蒸発散：多くベースライン負 ²（説明不能）となる中、AEF みが正 ²を達成し、有意な差を示した。これ蒸発散決定要因である気候パラメータを学習しているといえる   ◦ 定量・定性比較で、空間的な滑らかさ（coherence）を保ちつつ空間解像度も維持している点が強調された。  蒸発散推定 (回帰タスク)  Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

実験: 結果 (Change detection)   15 土地被覆・土地利用前年ー今年変化抽出評価  
• AEF（AlphaEarth Foundations）埋め込みに対し、線形分類器（Linear probe）や kNN を適用   ◦ 新たに物が増えた/減った “変化種類”でなく、変化有無だけにフォーカス   • 二時期で特徴量に変化あった場所をラベルとする教師あり学習と、教師なし変化検出を行い、AEF ベースラインを一貫して上回る     Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

実験: 結果 ( caling source data quantity and type)  
16 • 観測量スケーリング (右図A)   ◦ 同じデータまま、地点あたり観測枚数を増やすと性能どう伸びるかを検証   ◦ 観測を段階的に追加し、各データセットで BA 性能を比較  ◦ 15 データセット中 9 で単調増加（観測枚数が増えると性能が改善）    • ソース種別スケーリング (右図B)   ◦ 地点あたり観測量固定し、利用するソース群を光学/レーダ/LiDA /環境/アノテーション順に段階的に追加し、max-trial 線形分類性能を比較   ◦ ソース多様化ほど性能向上する傾向。ただしタスク依存で場合によって減少   ◦ 異種センサー（光学/レーダ/派生地図等）を統合するモデルなでそもそも1つモダリティだと性能が出づらい  ◦ 15データセット中で11が全群ありがベスト   Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

Global embeddings dataset   17 • 学習済み地理特徴量を公開   ◦ 各ピクセル（10
m解像度）に対し64次元埋め込みベクトルを割り当て、1年分時系列観測（光学・ A ・LiDA 等複数センサー）   ◦ 2017–2024年陸域と浅海（干潟・礁・内水域・沿岸）を網羅   ◦ 物理的な反射より扱いやすい特徴量なで、雲・スキャンライン等入力アーティファクトや欠測影響を低減し、分類・回帰・クラスタリング・変化検出特徴量としてそまま代替利用が可能   ◦ Google Earth Engineで公開しているで、土地被覆分類入力特徴、年次変化検出（特徴量内積差）、下流モデル弱教師学習共通表現などに使える   1ピクセルあたり64次元特徴量が格納されている  Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

Discussion   18 極端な低ショット（10ショット & 1ショット）による比較     • 極端にラベルが少ない環境（10
or 1 サンプル / class）で、手法間性能差が非常に小さく   ほとんどランダム範囲内という結果が多々見られた   • 例え、500回 10ショット実験において、AEF 性能向上が90％信頼区間内で優れていた   15評価中8件、1ショットでそうち5件にとどまった   → 平均的に AEFがやや優位な傾向ですが、非常に高いらつきがある点に注意が必要     結論  1～10ショットという超少数データ領域において、汎用的にうまく動作する解法まだ未確立であり、   AEFも万能と言えない挑戦的な領域   Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

Discussion   19 分類タスク     • AEF 、全分類タスクにおいて非常に安定した  
優れた性能を示した   • カナダ農作物分類などで、AEFに次いで   時空間特徴を使ったモデル精度が良かった   • 米国樹木分類などで、AEFに次いで   局所的な地球観測情報をうまく取り込んでいる   可能性がある atCLIPなどが精度が良かった   • 全般的に、Prithvi パフォーマンス低い   → 低ショット分類タスクに適しておらず、   ファインチューニングが必要     結論  AEF 極少ショットでもシンプルな線形分類器やk-NNを使っても   一貫した高性能を達成しており、ラベルが少ない領域で非常に   有望な基盤特徴空間となっている   Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

Discussion   20 回帰タスク     • 平均絶対誤差（MAE）削減や、説明変数として  
成立性でも他手法を上回った   • 特に A E GED（地表放射率推定）において、   他手法で負性能を示すもがある中、AEF 常に   妥当な値を出した  • OpenE （蒸発散推定）に関して、AEFだけが唯一   まともに性能を確保できた手法であった   • MAE 点でも、AEF 誤差レベル元データセット   期待範囲内であった     結論  回帰ように連続値を予測するタスクでも、AEF 非常に   信頼性が高く他手法と差が明確   Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

Discussion   21 変化検出タスク     • 土地被覆や利用変化分類と、非教師あり手法による
  閾値ベース検出両方を評価   • 教師あり分類で、AEFが78.4%（BC／線形分類）、   79.3%（kNN）バランス精度を達成し、次に精度が   良い手法 72%程度にとどまった   • 非教師あり閾値検出でも土地被覆変化検出で AEFが   最も良く、土地利用変化で i に若干劣る結果となった   ただし、教師あり学習有用性も示された     結論  AEF 、変化検出ような時間的コンテキストを必要とする   タスクにおいても非常に有効   特に教師あり設定で明確な優位性がある     Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

Conclusion   22 • 何をしたか？  ◦ AEF 、地球観測データをまとめて「時間的に連続した表現（embedding）」に   変換できる仕組みを構築
  ◦ これにより、観測データ特有ノイズや欠損があっても頑健に扱えるようになった     • 何が分かったか？  ◦ データが少ない状況でも、従来手法よりも一貫して良い性能を示した   ◦ 生物多様性・生態系・農業など、幅広い分野に役立つことが確認された     • なぜ重要か？  ◦ 大量アノテーションデータがなくても、地球表面空間的・時間的変化を効率的に把握できる   ◦ 新しい衛星が増えたり古い衛星が退役したりする中でも、研究者や政策立案者が地球状況を   理解し、適切な判断に活かす助けになる。     • 結論  ◦ AEF 、現在そして将来にわたって、現地観測データや注釈を拡張し、膨大に増え続ける   地球観測アーカイブを正確かつ一般的に活用するため有力な解決策である   Christopher F. Brown et al. (2025), “AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data”, arXiv 2507.22291. より引用

論文を読んだ後感想   23 • リモートセンシング界隈だとデータに値段がつくため、オープンにすることが難しいと思うが、特徴量ベクトルに変換することでオープンにするという観点１つアイディアだと思いました（中村）  •
フォン・ミーゼス分布を用いて確率的に位置をずらしている点ユニークだなと思いました（中村）  • 良い埋め込みがあれ簡易な機械学習モデルでも分類できるで、貧者なマシンでも動くがうれしい（篠原）  • エンコーダ重みも公開されているであれ、自分新しいデータを入れても良い特徴が得られるで応用が効きそう（篠原）  • データｘマシンｘお金みたいなＧooooooooooooooooooooogleに任せて、こ領域以外で戦うしかないかな～～っていう悲しみもある（篠原）←ほんとうにそうですよ泣 (平出)  • 時系列方向も考慮して埋め込みを出力していて、いろいろな使い道ができそう. (藤野)  • 最近、 ision系で埋め込みを出力するモデルが多く出ている気がする,DINOv3とか、いろいろ発展していきそう(藤野)  • 簡単な解析であれ誰でもそれなり精度を出せるで、ビジネスサイドから考えると競争激化により既存サービス価格破壊に繋がる可能性 (平出)  • 衛星解析に、データセット選定と前処理にかなり時間を要していたですが、これがスキップできるが画期的な考え。しかしながらデータセットと前処理をしっかりやることで解析いろを学べるで、本当初学者一連解析を自分で試してみて、慣れてからこういうデータセットを使うがよいだろうと思いました。(平出)  • 埋め込みベクトルが公開されていると、多く人々がリモセンデータを用いた解析を行いやすくなるで、公開されたデータセット利活用を期待したいなと思いました（青木）  • リモセン分野もでかいモデルででかいデータを扱う面でGoogleと正面切って勝負する無理っぽい、ドメイン知識に基づいて” 何故そタスクをやるか”が問われる時代になりそうです（しまだ）  • 一年間情報が圧縮されているで、年内変動を追跡する必要がある場合でそまま使えない難しさです（しまだ）   

AlphaEarth Foundations: An embedding field mode...

AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data

SatAI.challenge

More Decks by SatAI.challenge

Other Decks in Research

Featured

Transcript

中村凌・篠原崇之・青木亮祐  藤野倫太郎・平出尚義・嶌田将貴  1 第16回 atAI.challenge勉強会  AlphaEarth Foundations: An embedding field

中村凌株式会社天地人 / SatAI.challenge 主宰 / cvpaper.challenge HQ •

自己紹介   3 研究テーマ：３次元モデリング、サロゲートモデル、動的システム、土木インフラ 3 X(旧 Twitter) LinkedIn 産総研

4 自己紹介  平出尚義 (ひらでなおよし)     ・一般財団法人リモート・センシング技術センター

藤野倫太郎東京理科大学大学院　創域理工学専攻　社会基盤工学研究科　修士1年　 - 東京理科大学　水理研究室所属　　- AcademiX(AIを学びたい学生が集まるコミュニティ) 運営メンバー　　-

青木亮祐（ぴっかりん） • 株式会社パスコ研究開発センター ◦ 地理空間情報×AIで色々行ったり、そ環境整備 • Project

嶌田　将貴（シマダ　ショウキ） • JAXA地球観測研究センター（EORC） • 専門地球観測衛星データ解析による環境変化定量化や、農業など食料分野における情報整備

異なるモダリティ・時間データ地理空間表現を埋め込むため方法紹介と性能紹介   埋め込みベクトルデータセットも公開予定   8 AlphaEarth

背景　  • 数十年で地球観測（EO）データ広く利用可能になり、現在、地球生態系と気候過去、現在、未来に関する問いに答えるために用いられてきた   • 地球観測（EO）データ

• AlphaEarth Foundationsと衛星（ entinel-1/2・Landsat 8/9）など複数ソース・空間・時間までを一つ特徴量で表現する“埋め込みフィールド（embedding field）”モデル

実験: 評価手法(Evaluation in realistic data-scarce scenarios)   11 • 評価

実験: タスク・データ紹介   12 Christopher F. Brown et al.

実験: 結果( hematic mapping)   13 • 土地利用/土地被覆/作物検出/作物種別/樹種分布を評価   ◦

実験: 結果 (Estimating biophysical variables)   14 • 上空画像から直接観測しにくい量（地表放射率（emissivity）、蒸発散（E ））を回帰タスクで評価

実験: 結果 (Change detection)   15 土地被覆・土地利用前年ー今年変化抽出評価

実験: 結果 ( caling source data quantity and type)

Global embeddings dataset   17 • 学習済み地理特徴量を公開   ◦ 各ピクセル（10

Discussion   18 極端な低ショット（10ショット & 1ショット）による比較     • 極端にラベルが少ない環境（10

Discussion   19 分類タスク     • AEF 、全分類タスクにおいて非常に安定した

Discussion   20 回帰タスク     • 平均絶対誤差（MAE）削減や、説明変数として

Discussion   21 変化検出タスク     • 土地被覆や利用変化分類と、非教師あり手法による

Conclusion   22 • 何をしたか？  ◦ AEF 、地球観測データをまとめて「時間的に連続した表現（embedding）」に   変換できる仕組みを構築