Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

Earth AI: Unlocking Geospatial Insights with Fo...

Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning

本資料はSatAI.challengeのサーベイメンバーと共に作成したものです。
SatAI.challengeは、リモートセンシング技術にAIを適用した論文の調査や、より俯瞰した技術トレンドの調査や国際学会のメタサーベイを行う研究グループです。speakerdeckではSatAI.challenge内での勉強会で使用した資料をWeb上で共有しています。
https://x.com/sataichallenge
紹介する論文は「Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning」です。
この研究では、衛星画像/航空写真/地上センサーや統計/気象データなどがサイロ化しており、横断分析が難しい課題に対して、「Planet-scale Imagery」・「Population」・「Environment」 の 3 ドメイン向け基盤モデルを揃えた Geospatial AI(GeoAI)プラットフォームを提案した。このプラットフォームではGemini を用いた Geospatial Reasoning Agent(以下 GRA)が、自然言語クエリを分解し、複数の Earth AI Models や地理空間 API を順次呼び出して、複雑な危機対応シナリオにも対応できるようにし、ハリケーンの被害把握やQAベンチマークで高い性能を示した。
この結果は、基盤モデルやAPIなどのツール群を潤沢に揃えることで、ユーザーの課題を幅広く解決できることを示唆した結果である。

Avatar for SatAI.challenge

SatAI.challenge

November 29, 2025
Tweet

More Decks by SatAI.challenge

Other Decks in Research

Transcript

  1. Earth AI は 3 ドメインの基盤モデルと地理空間エージェントを統合したプラットフォーム 
 3 Earth AI: Unlocking

    Geospatial Insights with Foundation Models and Cross-Modal Reasoning 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用 • 衛星画像/航空写真/地上センサーや統計/気象データ などがサイロ化していおり、横断分析が難しい 。
 • そこで、Earth AI は、「Planet-scale Imagery」・ 
 「Population」・「Environment」 の 3 ドメイン向け基盤モデ ルを揃えた Geospatial AI(GeoAI)プラットフォームを提 案。
 • Gemini を用いた Geospatial Reasoning Agent(以下 GRA)が、自然言語クエリを分解し、複数の Earth AI Models や地理空間 API を順次呼び出して、複雑な危機 対応シナリオにも対応可能 。
 • ハリケーンの被害把握やQAベンチマークで高い性能を 示した。

  2. Introduction:リモセン分野の問題点 
 • サイロ化:
 ◦ 衛星・センサ・人口統計などの地理空間データは、空間分解能・時間分解能・カバレッジがばらばらで、そ のままでは統合解析が難しい。 
 ◦ リモートセンシングの現場では、画像・気象・人口統計などを手作業で集約し、

    
 個別のモデルを組み合わせて解析する運用が依然として多い。 
 • 統合解析が難しい
 ◦ データ量は増え続ける一方で、高品質なラベルや地上真値は限定的であり、 
 単一タスクごとにモデルを作り直すコストが高い。 
 ◦ 独立したモデルが多く、横断的な解析がやりにくい。 
 ◦ 専門家の知識が必要で手作業が多く発生する現状である防災・気候・公衆衛生などの領域では、 
 このようなデータを短時間で統合し、即時的に意思決定に結びつける仕組みが強く求められている 。
 
 地球観測向けマルチモーダル・マルチタスクなAIと地理空間エージェントを組み合わせたシステムが必要 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用 膨大でサイロ化した地理空間データは依然として解析のボトルネックである
  3. Introduction:EearthAIの提案 
 • 解析モデル
 ◦ Imagery: リモートセンシング画像 
 ◦ Population:

    人口動態 
 ◦ Environment: 環境
 • オーケストレーション 
 ◦ Geminiベースの地理空間エージェントで 
 データ取得から解析までを実行 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用 Geminiをを利用した複数のモデルを束ねる地理空間リーズニングエージェントの構築 
 非専門家でも複雑な地理空間解析を対話的に実行可能になる 

  4. 手法の全体 
 Earth AI は 3 つの Earth AI Models

    と GRA からなる統合フレームワーク 
 • Earth AI Models :「Imagery」「Population」「Environment」 基盤モデルから構成。 
 ◦ 各 Earth AI Models は、行政区や郵便番号などの共通地理単位に集約された埋め込みを出力し、下流タ スクではこれらを特徴量として予測モデルを学習。 
 • Geospatial Reasoning Agent(GRA) : Gemini ベースの LLM エージェント 
 ◦ どの Earth AI Models・外部 API・地理空間ツールをどの順番で呼び出すかを計画・実行 。
 ◦ 「Think & Plan → データ取得・推論・学習 → Reflect & Recover」というループで動作し、必要に応じて追 加データ取得やモデル再学習を行い、回答を洗練させる。 
 • 全体として Earth AI は、モデル群・エージェント・地理空間 API を一体化し、単純な問い合わせから複雑な危機 対応シナリオまでを一貫して扱える GeoAI プラットフォームとなっている。 

  5. • Remote Sensing Foundations(RS-F) 
 ◦ DatasetsからRS画像の認識を行うためのFoundation Model 群。 


    ◦ 右図のアプリケーションを行うためにRS-Fを学習する。 
 Remote Sensing Foundationsの概要 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  6. • RS-Fのデータセットは「航空写真/衛星画像」とGeminiを用いて作成される。 
 • データセットは3タイプ存在 
 ◦ キャプションと物体検出ラベル 
 ◦

    セグメンテーションと物体検出ラベル 
 ◦ Webスケールのテキスト画像データセット 
 Remote Sensing Foundations:Datasetsの説明 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  7. Remote Sensing Foundations:RS-F は RS 画像向けの VLM・OVD・ViT バックボーンからなる 
 Aaron

    Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用 • RS-F の には「VLM」、「Open-Vocaburaly detection(OVD)」、「ViTの 事前学習」の3つのモデルがあり、その役割は以下の通り 
 ◦ VLM :RS 画像とテキストを共通の埋め込み空間に写像し、自 然言語によるゼロショット分類やクロスモーダル検索を可能 に。
 ◦ OVD:VLM の埋め込みを利用して、学習時に存在しなかった カテゴリも自由テキストのクエリで検出できる物体検出モデ ル。
 ◦ ViTの事前学習:多数のラベルなし RS 画像と少数のラベル付 きデータを用いてマルチタスク事前学習され、分類・検出・セグ メンテーション・インスタンスセグメンテーションのFine-Tuning に利用される。

  8. Population Dynamics Foundations:PD-F は人間の活動と環境を統合した人口動態埋め込みを提供 
 • PD-F は地図データ・検索トレンド・匿名化された混雑度・気象・大気質などのデータをもとに、 
 グラフニューラルネットワークを用いて行政区や郵便番号ごとの人口動態埋め込みを生成する

    
 基盤モデル(PDFM)を拡張。
 • PDFMの埋め込みはプライバシー配慮の設計となっており、個人を特定することなく、移動パターンや 
 経済活動の違いを表現可能。 
 • 本論文では、米国を対象にしてたPDFMを17カ国に拡張した Global PD-F を適用。 
 • 直近24ヵ月分の月次の埋め込みを作成し使用することで、動的な変化を予測。 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  9. Environment モデル群:気象・洪水・サイクロン予測を API として提供 
 • Environment モデル群:「気象予測」・「洪水予測」・「サイクロン予測」のモデルから構成。 
 ◦

    気象予測(Google Maps Platform Weather API):MetNetを利用し、気温、降水量、風、紫外線指数などの 240 時間先までの時間予報や 10 日先までの日別予報を提供。 
 ◦ 洪水予測(Google Flood Forecasting API):河川洪水の浸水範囲・深さ・確率をリアルタイムに予測。2025 年 8 月以前の履歴も参照可能。 
 ◦ サイクロン予測:(ニューラルネットワークに基づく)実験的サイクロンモデルを用いて、最大 15 日先まで 50 通りのサイクロンの発生、進路、強度、規模、形状を予測。 
 過去のデータは2022年1月1日まで遡って利用可能。 
 • これらの Environment のモデル等 は、Earth AI 内の予測タスクだけでなく、GRA を介した対話的なクエリや危 機対応シナリオでも呼び出され、他の FM と組み合わさって利用される。 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  10. • GRA は、クエリを「分析・関係」「事実・検索」「予測・推論」の 3 種類に分解 し、それぞれに必要なツール・FM・ データソースを選択してシーケンスを組み立てる。 
 ◦ Imagery

    ドメインでは RS-F を呼び出して衛星画像の分類・検出・検索。 
 ◦ Population ドメインでは PD-F・Places API・Data Commonsを組み合わせて人口統計を取得。 
 ◦ Environment ドメインでは、洪水・サイクロン・気象の予測 API を利用し、必要に応じて TimesFM などの時 系列 FM を呼び出してSpatio-Temporalな予測を行う。 
 • ユーザインタフェースは地図とテキストを組み合わせた形で提供され、GRA がサブタスクの中間結果を地図上 に可視化しながら、最終的な自然言語の回答とともに提示する。 
 Geospatial Reasoning Agent:GRA は地理空間ツール群を統括するドメイン特化エージェントである 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  11. 実験設定:Earth AI の評価はモデル性能・予測シナジー・エージェント能力の 3 軸で行われる 
 • 評価 1:RS-F と

    PD-F 単体の性能を、公的な RS ベンチマークや空間補間タスクを用いて最新モデルと比較 し、地理空間表現としての強さを確認する。 
 • 評価 2:AE-F・PD-F・Environment モデルを組み合わせ、FEMA リスクスコア・CDC 健康指標・サイクロン被害・ コレラリスクといった実世界予測タスクでシナジーを定量化する。 
 • 評価 3:GRA について、事実・分析クエリからなる Q&A ベンチマーク 100 問と、危機対応シナリオ 10 問からな る Crisis Response ベンチマークを用いて能力を検証する。 
 • ベースラインとして、Earth AI 特有のツールを持たない Gemini 2.5 Pro / Flash エージェントを用い、同じ ADK 上 で Google Search や Maps の汎用ツールのみを使用させて比較する。 
 • これら 3 軸の評価により、「個々の FM が十分に強いか」「組み合わせることで予測がどれだけ向上するか」 「GRA によってユーザ体験がどこまで変わるか」を体系的に確認している。 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  12. 実験結果:RS-F と PD-F は既存手法を上回る地理空間表現能力を示している 
 画像を分析するモデル要素についての評価 
 • RS-F の

    VLM は、FMOW・RESISC45・AID などの RS ベンチマークにおけるゼロショット分類で既存の RS-CLIP や RemoteCLIP を上回り、多くのデータセットで SOTA を達成。 
 • ゼロショット画像–テキスト検索タスクでも、RS-SigLIP2 が RSICD・RSITMD などで従来モデルより高い精度を示 し、大規模チャットモデル系 VLM に匹敵する性能を示している。 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  13. 実験結果:RS-F と PD-F は既存手法を上回る地理空間表現能力を示している 
 Aaron Bell et al. (2025),

    “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用 画像~テキストの関係を分析するモデルの評価(セクション3.1.1) 
 • OVD では、DOTA・DIOR におけるゼロショット検出で mAP を OWL-ViT-v2 の約 2 倍に引き上げ、さらに 30 ラ ベルの Few-shot 学習により 50% を超える mAP を達成している。 
 • RS-Global MTP バックボーンは、13 の下流タスクで ImageNet 事前学習 ViT に対して平均 14.93% の性能向上 を示し、FMoW・FLAIR・DIOR では従来 SOTA を更新している。 
 • PD-F は、17 カ国での空間補間や Eurostat を用いたクロスカントリ予測で高い決定係数を達成し、他の地理空 間 FM を上回る結果が報告されている。 

  14. 実験結果:RS-F と PD-F は既存手法を上回る地理空間表現能力を示している 
 19 社会経済データ(人口)を分析するモデルの評価(セクション3.1.2) 
 • Population

    Dynamics Foundationによって人口に関する分析を実施。 
 • 関心のある変数予測において、SatCLIPやGeoCLIPと比べて高いパフォーマンスを達成。 
 • COVIDなどダイナミックな人口動態評価にも使える。 

  15. 実験結果:RS-F と PD-F は既存手法を上回る地理空間表現能力を示している 
 20 社会経済データ(人口)×画像分析を統合するモデルの評価(セクション3.1.3) 
 • サイクロンによる被害予測

    
 • サイクロンの経路予測と、画像分析AI出力・社会経分析分析出力を組み合わせ、建物被害の発生を予測 
 • コレラの予測にも活用 
 →ML出力の統合利用の有効性を示している。 

  16. 実験結果:Geospatial Reasoning Agentの性能評価 
 21 • Earth AI の Geospatial

    Reasoning Agentを使って、いかに“複雑な現実の問い”を解くかを ベンチマークで 定量評価したパート。 
 
 • ここでは「モデル単体の精度」ではなく、 
 Imagery FM/ Population FM/ Environment FM/API(Google Maps/ Data Commons/ EE等) 
 を LLM エージェントがどうオーケストレーションして問題を解くか にフォーカス。 
   多様なタスクに対して、どのモデル・どのツールをどんな順番で呼べばいいかをLLMエージェント 
   が計画・実行・修正する。 
 
 • ベンチマークは2種類を用意 
 下記2つに対して、自動評価ツール (Appendix) を用いた評価を実施。 
 1. Q&A 評価セット(Q&A Evaluation-set)。 
 2. 危機対応評価セット(Crisis Response Evaluation-set)。 

  17. 実験結果:Geospatial Reasoning AgentのFact-finding and Data Analyticsの性能評価 
 22 • 全100問のQAで、すべて明確な数値・リストの正解データを持っている

    
    ツールを正しく使って、正しい値を出せるかを確認。 
 Descriptive and Retrieval: 不変に近い事実の問答。 
 Analytical and Relational: 複数の時間・地域・変数の関係の問答 (ランキング、傾向、相関) 。 
 • Geospatial Reasoning がどのタスクにおいても最も精度が高いことが示されている。 

  18. 実験結果:Geospatial Reasoning Agentの危機対応(災害)のケーススタディ 
 24 • 危機対応(災害)に関する複雑なクエリを評価するためのセット。 
 • 例:ある時刻のハリケーンの予測進路に基づいて、どの州のどの人口層が、どの程度のリスクがあるか?

    
 • 1つの正解値があるわけではないので、各プロンプト毎に詳細な採点表を作成しており、回答を0-1の 
 スコアで評価する。(具体的な評価方法はAppendix) 
 圧倒的に本手法が強い

  19. 実験結果:Geospatial Reasoning Agentの危機対応(災害)のケーススタディ 
 25 Question
 ・2024年9月23日 12:00 UTC
  時点でのHurricane

    Heleneの予測進路は?
 
 ・フロリダ州の郡のうち、人口2万超の
  郡リストを取得せよ
 
 ・その中から、ハリケーン級の風が
  予測されている郡だけを抽出せよ
 
 Answer
 ・エージェントが適切なAPIを呼び出し、
  ハリケーンの予測進路と風速を取得
 ・風速の閾値を設定して、その領域を
  ポリゴンとして抽出する
 ・郡毎の人口の情報を取得して、
  フィルタリング
 • 「強力な FM+適切なAPI+GRAのオーケストレーション」が、汎用 LLM だけでは難しい地理空 間推論を安定的に実現することを示している。 

  20. 議論・限界点:センサ多様性・スケール・信頼性に課題が残る 
 • リモートセンシング基盤モデルの課題: 
 ◦ 高解像度 RGB 画像に焦点を当てており、マルチスペクトル・SAR・斜め撮影など、 


    リモートセンシング実務で重要なセンサの多様性にはまだ十分対応できていない。 
 ◦ 静的画像タスクが中心であり、時系列 RS タスクや長期変化検出への適用は今後の課題。 
 • 人口動態基盤モデルの課題: 
 ◦ 強力な人口埋め込みを提供する一方で、過去の履歴期間や空間解像度のさらなる拡張、 
 データ欠損が体系的に発生する状況での評価が必要とされている。 
 • 各モデルの統合の課題: 
 ◦ 多モダリティ統合では AE-F・PD-F・Environment モデルの空間・時間スケールを厳密に揃えることが難しく、現状は予 測変数ごとに特徴量生成やハイパーパラメータ調整が必要である 
 ◦ 一方、将来的にはこれらを統合的に学習する単一の meta-Earth モデルと、より汎用的な融合手法の確立が課題。 
 • エージェントの課題: 
 ◦ GRA の評価は Earth AI が想定したドメインとタスクに偏っており、多様性のあるドメインとタスクで、より厳密な評価指 標と人間の専門家レビューを伴う検証が今後求められる。 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用 本論文では「タスクごとのバラバラなモデル」から「複数FM+Geminiエージェントが連携する統合エコシステム」への転換を示し、モデル 選択とデータ統合を自動化するエージェントでドメイン専門家がデータサイエンス,GIS専門性抜きでも高度な空間解析を行える橋渡しと なることを示した。 

  21. まとめ・今後の展望:Earth AI は統合型 GeoAI へのロードマップを示す重要な一歩である 
 • サイロ化された地理空間データの統合 
 Earth

    AI は Remote Sensing Foundations(RS-F)、Population Dynamics Foundations(PD-F)、Environment モ デルと Geospatial Reasoning Agent(GRA)を統合した 
 これまでサイロ化されていた地理空間データを横断的に扱い、災害対応・公衆衛生・都市計画など多様なタスク で SOTA〜実務レベルの性能を示した。 
 
 • エージェントの効果 
 データ取得・前処理・推論・統合をエージェントが一気通貫でオーケストレーションできるので、 
 非専門家でも高度な地理空間情報解析が可能になる。 
 
 • 今後の課題と研究方向 
 単独モデルの寄せ集めではなく、モデル間の強調と融合ができるマルチモーダルな生態系が重要になり、 
 高度なエージェントによるオーケストレーションが今後重要になる。 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  22. 論文を読んでみての感想 
 • AIエージェントと既存のモデルを上手く組み合わせることで、これまで難しかった返答文が得られるようになって、AIエージェントの返 答文の限界点を考える良い機会になりました。大きく精度が上がったということで、AIエージェントによる創意工夫はまだまだ続きそう です。(中村)
 • 国内でもベンチャーやメーカーなどでエージェントを使った衛星画像解析のPoC/デモをやっている企業がいるが、 Goooooooooooooooogleとの違いを出すのが今後困難になるかもしれない。日本独自のデータなど差別化できるかなどが重要になる のかも?企業だけでなく、リモセンのドメイン側の専門家としての生き残り方を考えた方がいいかもなあ。今後、ドメイン知識でAIの結

    果を承認するおじさんとして生きていくのか......(篠原)
 • 地理空間に関する基盤モデルを組み合わせる仕組みを作り、推論させると色々なことが出来るんだなと
 改めて感じた。一方で、巨大なデータやリソースを持っているGoogleだからこそ出来る取り組みなので、日本ならではの強みを生か し、どう違いを出すかが重要になってくると思った(青木/ぴっかりん)
 • AIすごい、ジュニア職や卒論で扱う内容だとこれでいい気はする(ディープテック系の就職難がリモセン・GISにも来るかも)(嶌田)
 • リモセン知識の民主化ではある、しかし出力の正当性は誰が担保?AIのイタコに頼っていいのか(嶌田)
 • AIが言わないこと≠リモセンでできないこと、リモセン知識の深化が必要(嶌田)
 • 画像品質や校正検証みたいなところは人間の仕事として残り続けそう、一方でデカいデータをAIに突っ込んで解析、みたいなところは GoogleやAIに勝てない予感(嶌田)
 • ネット上に出回る情報に基づいている以上は、光学RGBの画像表示に教師データが偏っている気がしなくもない。ハイパースペクトル や熱赤外、マイクロ波解析など、不可視電磁波領域にはまだ活路があると予想(嶌田)
 • FMだけでやりくりするのではなく、FM+APIをエージェントで選択して使用するというアイデアが素晴らしい。この考え方は拡張性が非 常に広く、GoogleのFMだけにとどまらないので、期待。一方で、この流れが加速したときに、リモセン解析者の立場が危うくなる。乗る しかない、このビックウェーブに。(乗らないと置いていかれる) (平出)
 • だれかリモセン日本勢、Google ResearchかDeepMindあたりに入ってください!!!!! (平出)
 • GEEやMAP,検索エンジンの技術そしてデータをもっているGOOGLEならではの壮大内容だと思った。
 USGSとかNASAとかOSMとかのデータとオープンソースVLMで劣化版でもいいので似たようなものがあると面白いかも
 (柴田)
 • ALOS-2/4の高解像度版やフルポラデータはGEEに載っていないので、このモデルでは加味できていないはず。オープンデータに頼 るAI構築から得られる結論は、リモセンデータの全てを網羅している議論ではない(嶌田)

  23. 中村 凌 株式会社天地人 / SatAI.challenge 主宰 / cvpaper.challenge HQ •

    株式会社天地人データサイエンティスト (2024/04 - 現在) • SatAI.challenge 主宰(2024/09 - 現在) • cvpaper.challenge HQ(2021/1 - 現在 ) • 福岡大学大学院 理学研究科 応用数学専攻 博士課程(2021/04 - 2024/03) • 産業技術総合研究所 コンピュータビジョンチーム RA(2021/05 - 2024/03) • 福岡大学大学院 理学研究科 応用数学専攻 修士課程(2019/04 - 2021/03) 自己紹介 Twitter LinkedIn 31 これまでの個人的な活動 • 研究効率化Tips (ViEW2021招待講演) • 国際会議への論文採択実績(IROS / ICCV 2023, ICASSP / ECCV2024) • CCCS,W2021/2022 GC PC(登録者800名超え) • SSII2023オーディエンス賞受賞 • SatAI.challenge運営(国際論文の日本語資料・動画のアーカイブ化)
  24. 自己紹介 
 32 研究テーマ :3次元モデリング、サロゲートモデル、動的システム、土木インフラ 32 X(旧 Twitter) LinkedIn 産総研

    - サロゲートモデル: 制御x深層学習モデル - 土木インフラxAI: インフラ劣化予測 篠原 崇之
  25. 33 自己紹介
 平出 尚義 (ひらで なおよし) 
 
 ・一般財団法人 リモート・センシング技術センター

    (RESTEC) 
 ・筑波大学大学院 博士課程後期1年生 (2025/04 -, 社会人D) 
 
 - 国/地域レベルでの土地利用土地被覆分類 
 - 衛星の校正検証 (ラジオメトリック / ジオメトリック) 
 - 衛星データ×AI系 (抽出、分類、超解像、基盤モデル) 
 土地利用土地被覆図作成 
 校正検証業務 (現地測量) 

  26. 青木 亮祐(ぴっかりん) • 株式会社パスコ 研究開発センター ◦ 地理空間情報×AIで色々行ったり、その環境整備 • Project PLATEAU

    ADVOCATE 2025 • 一般社団法人OSGeo日本支部( OSGeo.JP ) 運営委員 自己紹介 34 X(旧Twitter) GitHub 過去に個人で行った衛星データ関連の発表
 個人開発したPLATEAU APIのMCPサーバー

  27. 柴田たけお フリーランサー 東北大学理学部、カリフォルニア大学バークレー大学院で地物専攻 その後IT業界で30年近くSYSTEM ENGINNERとしてシステム開発にかかわる 現在はAIや数理最適化とGISやリモートセンシングを組み合わせたソリューションに 興味あり 最近開発活動( POCも含む) •衛星.GIS関連:

    衛星画像LANDSATと統計データを利用した新潟県の収穫量予測, 物流の最適運搬システム •一般AI関連: 音声特徴量での健康診断, 顔認証, 画像生成, 自動コード生成, END2ENDでのAI医療応用提案 •その他: SNSのコメントと写真情報からの災害対応システム 自己紹介 36
  28. モデル統合による予測:Earth AI は複数ドメインの埋め込みを統合して予測性能を向上させる 
 • Earth AI では、AE-F と PD-F

    を共通の行政区レベルに集約し、それぞれの埋め込みを特徴量として統合した予 測モデルを構築している。 
 • FEMA の災害リスクスコア予測では、AE-F 単独または PD-F 単独よりも、両者を組み合わせたモデルのほうが 20 指標の平均で 11% 高い決定係数を達成している。 
 • CDC の健康指標 21 変数の予測では、AE-F+PD-F の組み合わせが、PD-F 単独に対して 7%、AE-F 単独に 対して 43% の性能向上を示している。 
 • サイクロン被害予測やコレラリスク予測では、Environment モデルからの動的予測と PD-F の静的埋め込みを 組み合わせることで、建物被害数や患者数の予測精度を高めている。 
 • これらの結果は、「物理(画像・気候)×人口行動×環境予測」のシナジーが、単一モダリティでは得られない実 用的な予測性能をもたらすことを示している。 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  29. Introduction:目的 
 • 
 • 自然災害リスク評価や避難計画、公衆衛生上のホットスポット検出など、多くの意思決定は地理空間データと密 接に結びついている。 
 • 従来は専門家が

    GIS や統計・プログラミングを駆使して解析する必要があり、時間と専門知識の面でボトルネッ クとなっていた。
 • Earth AI は、非専門家でも自然言語で質問し、背後で基盤モデルとツール群が連携して答えを出せる「地球観 測のインタフェース」を提供しようとしている。 
 • 特に危機対応では、洪水・サイクロン・熱波などの予測と人口脆弱性情報を組み合わせ、時間的余裕のない状 況での支援配分を支援することが重要である。 
 • 本論文は、このような実世界のユースケースを意識しながら、Earth AI の基盤能力と危機対応シナリオでの有 効性を定量評価している。 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用 社会課題に直結する意思決定を支える基盤としてEarth AIが必要
  30. 補足資料 
 • リモートセンシング Foundation Model は、衛星・航空写真を事前学習した画像モデルであり、分類・検出・セグメ ンテーションなど多様なタスクに転移可能な表現を学習している。 
 •

    Vision-Language Model(VLM)は、画像とテキストを共通の埋め込み空間にマッピングし、ゼロショット分類やテ キスト検索による画像検索を可能にするマルチモーダル FM である。 
 • Population Dynamics Foundations(以下 PD-F)は、地図・検索トレンド・匿名化された混雑度・環境条件を統合 し、地域ごとの人口行動を表現する地理空間埋め込みモデルである。 
 • AlphaEarth Foundations(以下 AE-F)は、光学衛星・レーダ・気候シミュレーションなどを統合した 10 m 解像度 の地球表現であり、物理的な地形・土地利用をコンパクトな埋め込みとして提供する。 
 • Google の時系列用 Foundation Model である TimesFM は、コレラ予測や公衆衛生データなどの長期予測に利 用され、他の FM と組み合わせて性能向上に寄与する。 
 • 気象・洪水・サイクロン予測モデルは、短期気象・河川氾濫・トロピカルサイクロンの確率予測を行う深層学習モ デル群であり、Earth AI では API として統合されている。 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用 Earth AI を理解するための前提技術
  31. 従来手法はモダリティ統合とユーザビリティに大きな制約があった 
 • RS・人口・環境の FM はそれぞれ個別に開発され、空間・時間解像度や地理単位が揃っておらず、そのままで は統合しづらいという課題があった。 
 • 従来のワークフローでは、研究者や実務家が

    GIS・統計ツール・コードを組み合わせて、データ取得から前処 理、モデル適用、可視化までを自前で構築する必要があった。 
 • FM 同士を組み合わせた予測事例は存在したものの、複数ドメインの FM を系統的にアラインし、災害や公衆衛 生など複数タスクで相乗効果を定量評価した研究は限られていた。 
 • LLM エージェントによる GeoAI も提案されているが、地理空間向け専用ツール群や FM との密な統合が不十分 で、信頼性の高い危機対応シナリオの評価も限定的だった。 
 • Earth AI は、「3 ドメインの FM を揃え、共通地理単位へアラインし、GRA が統合的に利用する」という一貫したフ レームワークでこれらの課題に挑んでいる 
 Aaron Bell et al. (2025), “Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning”, arXiv:2510.18318. より引用
  32. 今日のアジェンダ 
 42 1. セクションごとに担当領域を決定(10分) 
 a. タイムキーピング・全体調整係(スライドのレイアウトの修正や足りないところにアサインする担当) 
 b.

    各セクションの担当
 2. 各章の要点を事実チェック・人手で修正する&図を差し込む 40分 
 3. 各セクションの横断修正・全体理解 10分 
 4. 読み合わせ10分
 5. 感想書く時間 10分
 6. 反省
 
 前回の反省
 LLMの要点書き出し・修正で思ったより時間がかかりすぎた。→事前にLLMの要点の書き出しを行い、修正に注力 
 どうやったら改善できる? 
 今回は謎のホワイトペパー過ぎたので、ある程度体型づいた論文だといけるかも? 
 ChatGPTの要約が思ったよりいけてなかった。(要約と理解のしやすさに距離があった) 
 ↑NotebookMLを使って理解を深める仮定には意味があるかも? 
 

  33. 1. Introduction 1人(柴田、篠原) 
 2. Earth AI Capabilities 2人 (中村、ピッカリン)

    
 ◦ Earth AI Models
 ▪ Imagery: Remote Sensing Foundations 
 ▪ Population: Population Dynamics Foundations 
 ▪ Environment: Weather & Climate Models 
 ◦ Combining Earth AI Models: Predictive Applications 
 ◦ Orchestration: Solving Complex Queries with Geospatial Reasoning Agents 
 3. 実験結果 2人 (嶌田、平出)
 ◦ Earth AI Models 
 ◦ Combining Earth AI Models: Predictive Applications 
 ◦ ~~~~
 4. Discussion 1人 (柴田、篠原) 
 5. Conclusion / Future Work1人(柴田、篠原) 
 
 43 XXXX 

  34. ワークショップの反省点 
 44 • 今回のやり方論文まとめ40分は足りない?時間が足りない感があったかも(中村) 
 • 15分発表想定(1スライド1分、18ページ程度)でLLMの事前サマリを作成したが、今回はボリュームの有る論文 だったので、その想定を調整してもよかったかも(中村) 


    • 発表15分を想定したボリューム感のAIサマリー箇条書きが初期値だと嬉しい(今日のやつだと、おそらく発表時 間より多い枚数
 • 用語の統一をするのがセクション単位で人を区切ると難しい、論文中に出てくる用語一覧は最初に定義したい 
 • 今回の論文だと、既に発表されている論文を参考にしているとことが多かったので、 
 そこも含めてAIでドラフトのスライドが作成できると嬉しい 
 • 分からないところがあった時に、他の人にすぐに聞けるのが良かった 
 • 三人よれば文殊の知恵、複数人で読むのはそれぞれの専門分野を相補的に活かせて素晴らしい(嶌田) 
 • 参加メンバーの専門分野はある程度わかっているので(自己紹介スライドなど)、AIに分担も考えさせる⁉(嶌田) 
 • つくば組などは対面で集まりやすいので、いつか対面+オンラインでやってもいいかも?(嶌田) 
 • 文章にされるより、骨子レベル+キーワードもしくは1センテンスの方が、コンファーム作業がやりやすい気がす る
 • 勉強会中に議論を交わすのは集まってできるからこその技なので、そういう学びを大事にしていきたい(中村) 
 • 担当箇所の難易度の予測が難しかった。今回は全体俯瞰してないと少し大変だと予想したが結局翻訳まとめで 比較的容易なタスクになった。(柴田) 
 • 事前に参加できる人の人数を確定できるとよかったかも?メンバーの割り振りは事前に決めておくと時間が確保 できそう(中村)
 • 全体概要 (アブストラクト) を一番初めに5分程度みんなでさらえるとさらにいいかも。みんなでわちゃわちゃやる のとってもたのしい。 (平出) 

  35. 出席
 45 神山さん
 二村さん
 参加
 書記
 篠原さん
 中村さん
 不参加
 中村さん


    嶌田さん
 佐々木さん
 青木さん
 草さん
 平出さん
 笹川さん
 柴田さん
 藤野さん
 河内さん