$30 off During Our Annual Pro Sale. View Details »

自律移動システムの航法における基盤モデル・世界モデルの概観 〜航法におけるPhysicalAI...

Avatar for godel godel PRO
December 04, 2025

自律移動システムの航法における基盤モデル・世界モデルの概観 〜航法におけるPhysicalAI〜 A Survey of Foundation Models and World Models in Navigation for Autonomous Mobile Systems: The Era of Physical AI

要約(Abstract)
 近年、自律移動システム(AMS)の領域では、サイバー空間で発展したAIモデルを物理的な身体性を持つシステムへ適用する「Physical AI」への進化が加速している。特に、環境の物理法則を学習し未来を予測する「世界モデル(World Models)」や、知覚から行動制御までを一気通貫で処理する「視覚-言語-行動(VLA)モデル」の実装が急速に進展している。  昨年の本大会において、我々は生成AIを用いた航法技術の概念とその可能性について議論した。本稿ではその続編として、実際に提案・実装され始めた具体的な基盤モデルアーキテクチャを対象に包括的なサーベイを行い、これらの技術がいかにしてAIを物理世界に接地(Grounding)させ、真のPhysical AIを実現するかについて考察する。

測位航法学会 GPS/GNSSシンポジウム2025

Abstract

In recent years, the field of Autonomous Mobile Systems (AMS) has witnessed an accelerated evolution towards "Physical AI," where AI models developed in cyberspace are applied to systems with physical embodiment. In particular, there has been rapid progress in the implementation of "World Models," which learn the physical laws of the environment to predict the future, and "Vision-Language-Action (VLA) models," which process tasks from perception to action control in an end-to-end manner. At last year's conference, we discussed the concepts and potential of navigation techniques utilizing generative AI. As a follow-up, this paper provides a comprehensive survey of specific foundation model architectures that have recently been proposed and implemented. Furthermore, we discuss how these technologies ground AI in the physical world to realize true Physical AI.

Institute of Positioning, Navigation and Timing Japan GPS/GNSS Symposium 2025

Avatar for godel

godel PRO

December 04, 2025
Tweet

More Decks by godel

Other Decks in Technology

Transcript

  1. NavLab 1 (1986) : Carnegie Mellon : Robotics Institute History

    of Self- Driving Cars(https://www.youtube.com/watch?v=ntIczNQKfjQ)
  2. ロボット基盤モデル ロボット基盤モデル(Robot Foundation Models、RFM)とは、多様なタスクや環境に対応できるように設計 された、非常に大規模で汎用的なAIモデル。 Vison Language Action (VLA)モデルが具体例であり、膨大なロボットの行動データを深層ニューラルネット ワークに学習(End

    to End Learning)させることで、汎用的なロボットのコントローラを構築することを目指し ている。 (ロボット)AIエージェント 世界モデル (ロボット)基盤モデル https://s.japanese. joins.com/JArticle/ 339516 中国のヒューマノ イドの学習データ の収集状況 膨大な学習データから、複数の基盤モデルが生まれる。 基盤モデルは、深層ニューラルネットワークの構成、潜在空間、ロス 関数などの組合せにより、無数のモデルが考えられる。 即ち、世界モデルも無数に考えられることになる。 航法用に特化した基盤モデ ル(VLN)も既に開発され ている