Upgrade to Pro — share decks privately, control downloads, hide ads and more …

サービスロボット最前線:ugoが挑むPhysical AI活用

Avatar for Ken Matsui Ken Matsui
August 21, 2025

サービスロボット最前線:ugoが挑むPhysical AI活用

Avatar for Ken Matsui

Ken Matsui

August 21, 2025
Tweet

Other Decks in Technology

Transcript

  1. Ⓒ ugo, Inc. 2025. All rights reserved. Ⓡ ugo株式会社 代表取締役CEO

    松井 健 【Algomatic x ugo x ABEJA共催】  ロボット持ち込み技術共有会 サービスロボット最前線 ugoが挑むPhysical AI活用
  2. Ⓒ ugo, Inc. 2025. All rights reserved. 松井 健 スマホApp


    システム開発 2023年3月 東証グロース上場 #1 2006- 2011 ugo株式会社 代表取締役CEO IoT機器
 受託開発・量産 #2 2011- 2020 ロボット開発 #3 2018- Now Ⓡ 2 システム開発 → IoT機器開発 → ロボ開発 6年 9年 7年〜
  3. Ⓒ ugo, Inc. 2025. All rights reserved. アジェンダ • “ugo”

    で取り組んできたこと • 学習用ロボットとしての“ugo” • “Physical AI”とサービスロボット 3
  4. Ⓒ ugo, Inc. 2025. All rights reserved. Ⓡ SCALE-OUT HUMAN

    POSSIBILITY “ugo” で 取り組んできたこと
  5. Ⓒ ugo, Inc. 2025. All rights reserved. CONFIDENTIAL IoTセンサー連携 ポーズエディタ

    マップエディタ ELVフロア移動 人検出 メーター読取 ボタン認識 ugo AI Toolbox AI Toolbox 時系列データマップ システム連携 ノーコード 自動化 Flow レポート PHOTO VIDEO ユーザー通知 Email Slack SMS Tel Call 複数ロボット連携
  6. Ⓒ ugo, Inc. 2025. All rights reserved. SI効率化と多彩なロボットシステムの創出を実現する 共創基盤開発 9

    引用)「SI効率化と多彩なロボットシステムの創出を実現する共創基盤開発」が NEDO公募事業に採択されました -ロボット未活用領域への導入推進に向けたロボット・ IT関連7社による共同事業- https://ugo.plus/information/2025/08/05/nedo_sirobosystem/
  7. Ⓒ ugo, Inc. 2025. All rights reserved. 12 点検ロボット 自動

    巡回 狭小空間 向け 小型 点検の デジタル化 メーター読取AI の特徴 メーター読取AI センサー拡張 自動アラート 伸縮+チルト 4Kカメラ
  8. Ⓒ ugo, Inc. 2025. All rights reserved. 国産 多脚型 点検

    AIロボットの開発 16 新たな多脚型ロボットを 研究開発 ・段差乗越性能 ・屋外走行対応 ・安全性 ・安定性 etc… 引用)ugo、 NEDO「ディープテック・スタートアップ支援事業( DTSU事業)」STSフェーズに採択 https://ugo.plus/information/2025/08/04/nedo_dtsusts/
  9. Ⓒ ugo, Inc. 2025. All rights reserved. 自動 巡回 遠隔

    監視 遠隔・自動 案内 映像配信・録画 音声発話 はじめまして 巡回経路設定 フロア移動 警備ロボット の特徴 18
  10. Ⓒ ugo, Inc. 2025. All rights reserved. 21 自動案内機能と Q&A管理機能

    ロボットが自動で受け答えする質問内容をビル毎に Q&Aデータとして管理します。 Q&Aデータ Q1. ◯◯の場所はどこ? A1. ◯◯は右手にまっすぐ進んで扉 手前にあります。 ・・・ ① 現場毎に異なる Q&Aデータを   管理画面に登録します。 音声認識 ② AIがQ&Aデータを参照し、   ロボが自動で回答します。 Flow実行 Flowを実行して 音声認識を開始します。 ◯◯の場所は どこですか? AIが、事前に登録された Q&Aデータを参照し、 質問に対して適切な回答を選び回答します。 ③ 案内のやり取りログを、   AIが要約して報告します。 ◉◉◉◉◉◉◉ ◉◉◉◉◉◉◉ 日々の様々な来訪者への応対の内容が ログとして多く残ります。 ◉◉◉◉◉◉◉ ◉◉◉◉◉◉◉ 案内やり取りログ AIが要約 管理画面で、日々の AIが応対した内容を効率 よく確認できます。
  11. Ⓒ ugo, Inc. 2025. All rights reserved. JR東日本|秋葉原駅 エキュート秋葉原の接客案内 22

    引用)ロボットが生成 AIとダンスで接客!エキュート秋葉原のロボットキャスト「 ugo Pro」が「エキュート・ザ・カレーフェス」を盛り上げます! https://prtimes.jp/main/html/rd/p/000000890.000082978.html
  12. Ⓒ ugo, Inc. 2025. All rights reserved. AIロボットは、更に進化する 23 画像認識AI

    カメラ画像で目視確認 の自動化 人検知機能 メーター読取機能 異常検知 対話AI コミュニケーション の自動化 音声認識・対話機能 ナレッジ管理機能( RAG) 多言語対応 Physical AI 物理世界の複合的な状況の 認識と反応 の自律化 映像・時系列データ・運動・環境などの 複数の物理世界のデータから 特定状況を理解し反応する Agentic AI 俯瞰的な傾向分析や行動計画立 案による自律化 マルチエージェントによる推論機能 分析とリコメンド機能 行動計画の最適化
  13. Ⓒ ugo, Inc. 2025. All rights reserved. Ⓡ SCALE-OUT HUMAN

    POSSIBILITY 学習用ロボット としての “ugo”
  14. Ⓒ ugo, Inc. 2025. All rights reserved. ロボット学習に適したティーチング手法 ロボットに人のスキルを教えるティーチング手法には様々な種類があり、それぞれ得られるデータ品質や収集 効率、必要な機材が異なります。

    26 キネステティク ティーチング 直示実演系 遠隔操作系 キャプチャ系 シミュレーション系 映像/モーション キャプチャ 設計された動作 ユニ/バイラテラル コントローラ VRコントローラ
  15. Ⓒ ugo, Inc. 2025. All rights reserved. Ⓡ SCALE-OUT HUMAN

    POSSIBILITY “Physical AI” と サービスロボット
  16. Ⓒ ugo, Inc. 2025. All rights reserved. 32 JST CRDS「フィジカル

    AIシステム(科学技術未来戦略ワークショップ報告書)」 JST研究開発戦略センター( CRDS)が、AIとロボティクス分野 で重要となる「フィジカル AIシステム」について議論するワーク ショップを開催しまとめた報告書。 フィジカルAIは、物理環境と直接相互作用し、人のように柔 軟・適応的にタスクを遂行する AIロボット を指す。 従来のサイバー空間中心の AIとは異なる、実世界価値創出が 期待されている。 【日本の課題と方向性】 • 海外の急速な進展に比べキャッチアップが必要 • 技術開発に加え、社会実装・産学連携・研究環境整備が 不可欠 • 「追いつく」だけでなく「新たな価値創出」へ 2025/1/26 開催
  17. Ⓒ ugo, Inc. 2025. All rights reserved. フィジカル AIシステムの発展の方向性 33

    引用)JST研究開発戦略センター( CRDS) 人工知能研究の新潮流 2025 ~基盤モデル・生成 AIのインパクトと課題~ https://www.jst.go.jp/crds/pdf/2024/RR/CRDS-FY2024-RR-07.pdf
  18. Ⓒ ugo, Inc. 2025. All rights reserved. サービスロボットをとりまく動的な関係性 34 センサー系

    アクチュエータ系 知能・制御系 空間 人 設備・装置 モノ ロボットをとりまく周囲とのインタラクション(関係性)
  19. Ⓒ ugo, Inc. 2025. All rights reserved. サービスロボットにおける “Physical AI”

    の役割 35 知覚 Perception 推論と判断 Reasoning & Decision Making 行動 Action 移動 Locomotion 物体操作 Manipulation 計画 Task Planning 状況理解 Situation 状況順応 Adaptability 指示認識 Intent Recognition 文脈理解 In-Context
  20. Ⓒ ugo, Inc. 2025. All rights reserved. “Physical AI” はロボットの状況認識をどう変えるのか?

    36 現在のロボ視覚情報 今のビル&フロア情報 過去の稼働ログ ugo Platform Operation Data ugo Robot Sensor Data 現在のロボ位置情報 この現場の業務ルール VLM LRM 状況理解 Situation 文脈理解 In-Context 状況順応 Adaptability 指示認識 Intent Recognition
  21. Ⓒ ugo, Inc. 2025. All rights reserved. 検証:VLMでどこまで状況認識できるのか? 37 検証軸

    説明 例 物体認識タスク ロボットの用途で重要な物体の検出・ 分類ができるか、属性含む 人・設備・メーター・ドア・階段など 状況理解タスク 単純な物体検出に加えて、特定のシー ンの意味を理解できるか 「人が倒れている」 「ドアが閉まっている」など 空間理解タスク 物体の位置や領域(バウンディングボッ クスを抽出)を特定できるか 物体の位置 (方向や座標情報) 状態認識タスク 物体の状態を理解できるか ランプであれば点灯・消灯 扉であれば開閉状態 関係性理解タスク 物体同士の関係性を理解できるか 「机の上にノートPCがある」 「握手を求められている」 シーン説明タスク 画像全体の状況を説明できるか 「この部屋の状況を教えて」
  22. Ⓒ ugo, Inc. 2025. All rights reserved. VLM検証:人のいるシーン 複数人が働くオフィススペース。 ロボットアームやその他の機器がある。

    白いシャツを着た人物が、ロボットとやり取りしている 様子。 環境は室内で、デスクや椅子、さまざまな技術的な設 備が空間全体に配置されています。背景の看板には 「目的」と「ミッション」と記載されている。 38 VLM 物体 状況 空間 状態 関係性 シーン説明 Qwen2.5-VL- 7b ◯ 人を認識 ◯ 何か持っている? Yes / Remocon ◯ 人はどちらに立っ ている? Left ◯ 人は立っている 座っている? Be standing △ trying to talk to the robotic device ◯ The image depicts a workspace with multiple individuals engaged in activities, possibly related to robotics or enginee… LLaVa-7b ◯ 人を認識 ◯ 何か持っている? Yes / Phone ◯ 人はどちらに立っ ている? Left ◯ 人は立っている 座っている? Standing ✕ Yes / No (hallucination) ◯ The man is wearing a white shirt, black pants, and a lanyard with an ID tag around his neck.
  23. Ⓒ ugo, Inc. 2025. All rights reserved. VLM検証:部屋のシーン シーンは、ロボット工学技術に焦点を当てた現代的な 室内設定。

    フレームの右側に、車輪の上で立っているヒューマノイ ドロボットが配置されています。 環境には、出口の標識が付いたドアと、スクリーンが 部分的に見えるようになっています。 ショールームの一部である可能性を示唆しています。 39 VLM 物体 状況 空間 状態 関係性 シーン説明 Qwen2.5-VL- 7b ◯ 扉を認識 ◯ 扉の方に行ける か? Appears capable ◯ ディスプレイはど こにある? Left ◯ 扉の状態は? appears to be closed ✕ No, there are no chairs under any desks ◯ The scene depicts a modern indoor setting with a focus on robotics technology. A humanoid robot is positioned to the right of the frame, … LLaVa-7b ◯ 扉を認識 ✕ 扉の方に行ける か? No △ ディスプレイはど こにある? In front of door ✕ 扉の状態は? Open ✕ No ◯ The image features a room with a doorway that is open to reveal a hallway beyond it. The hallway has a mirrored ….
  24. Ⓒ ugo, Inc. 2025. All rights reserved. Physical AI ロボット・アーキテクチャを考える

    40 ◯◯だから、 ◯◯をやっておいて。 ◯◯だから、 こうやってやっ ておけばいい かな?
  25. Ⓒ ugo, Inc. 2025. All rights reserved. Ⓒ ugo, Inc.

    2025. All rights reserved. System 1 : 小脳 直感・高速思考 複雑な推論、戦略的意思決定 System 2 : 大脳 論理・熟考思考 直感的・連続的な意思決定 41 LRM 大規模推論モデル VLA 視覚言語行動モデル VLM 大規模視覚言語モデル Embodied Reasoning 身体的推論 LLM 大規模言語モデル 1〜9Hz 周 期 7-8B、数十B 規 模 10〜60Hz 周 期 10M〜数00M 規 模
  26. Ⓒ ugo, Inc. 2025. All rights reserved. Physical AI ロボット・アーキテクチャ

    42 米 Figure社が開発する「Helix」の2層構造アーキテクチャ 潜在ベクトル(命令メッセージ) 現在のタスクに必要なセマンティックな情報を凝縮 両システムの共有メモリに格納 SYSTEM1 → OUTPUT タスク完了度 「タスク完了度(%)」を示す付加的な出力次元も S1から出力させ ている SYSTEM1と2が疎結合 1と2を明確に分離したことで、独立して改良・ チューニングができる構成 System2用 GPU System1用 GPU 引用)Figure - Helix: A Vision-Language-Action Model for Generalist Humanoid Control https://www.figure.ai/news/helix
  27. Ⓒ ugo, Inc. 2025. All rights reserved. CONFIDENTIAL ありがとうございました! 一緒に、Robot

    x Physical AI 開発しませんか? ugo 製品 Web 仲間を募集中!