$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
Search
Minoru Natsutani
November 15, 2025
Technology
0
43
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
GCPUG in Shiga #4 「はじめての生成AI Gemini・BigQuery」での発表資料です。
Minoru Natsutani
November 15, 2025
Tweet
Share
More Decks by Minoru Natsutani
See All by Minoru Natsutani
動き検出勉強会資料
natsutan
0
31
WindowsでGenesisに挑戦した話
natsutan
0
330
辛い仕事をプリキュアで乗り切りHack
natsutan
0
66
論文読み勉強会 RoboGen
natsutan
0
260
プログラミング写経のすすめ
natsutan
0
1.2k
ロボット模倣学習勉強会
natsutan
0
380
スモールデータ勉強会発表資料
natsutan
1
1.3k
Robotics勉強会資料
natsutan
0
85
Human-in-the-loop機械学習社内勉強会
natsutan
0
1.6k
Other Decks in Technology
See All in Technology
Haskell を武器にして挑む競技プログラミング ─ 操作的思考から意味モデル思考へ
naoya
6
1.4k
re:Invent 2025 ふりかえり 生成AI版
takaakikakei
1
190
直接メモリアクセス
koba789
0
290
第4回 「メタデータ通り」 リアル開催
datayokocho
0
120
SSO方式とJumpアカウント方式の比較と設計方針
yuobayashi
7
590
AWS Bedrock AgentCoreで作る 1on1支援AIエージェント 〜Memory × Evaluationsによる実践開発〜
yusukeshimizu
6
390
日本Rubyの会の構造と実行とあと何か / hokurikurk01
takahashim
4
1k
ガイドラインを軸にしたウェブアクセシビリティ改善
lycorptech_jp
PRO
1
100
ChatGPTで論⽂は読めるのか
spatial_ai_network
5
19k
意外とあった SQL Server 関連アップデート + Database Savings Plans
stknohg
PRO
0
310
年間40件以上の登壇を続けて見えた「本当の発信力」/ 20251213 Masaki Okuda
shift_evolve
PRO
1
100
生成AI活用の型ハンズオン〜顧客課題起点で設計する7つのステップ
yushin_n
0
130
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
YesSQL, Process and Tooling at Scale
rocio
174
15k
The Cult of Friendly URLs
andyhume
79
6.7k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.6k
Into the Great Unknown - MozCon
thekraken
40
2.2k
A Modern Web Designer's Workflow
chriscoyier
698
190k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Scaling GitHub
holman
464
140k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Become a Pro
speakerdeck
PRO
31
5.7k
Optimising Largest Contentful Paint
csswizardry
37
3.5k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Transcript
Google DeepMindのロボット技術紹介 ~ RT-1からGemini Robotics-ER 1.5まで 2025.10.09 @natsutan 1
2 自己紹介 株式会社パソナ 営業統括本部 エキスパート・BPO事業本部 X-TECH本部 第1エンジニア室 AIソリューションチーム プリンシパルエンジニア 夏谷実
X:@natsutan
3 ロボット業界の概要 ここ数年のブレークスルーはLLM。LLMの登場で今までできなかったことができるようになった。 アメリカ、中国を中心にヒューマノイドロボットの開発が盛ん。季節に一回は大きな発表がある。 ・日本、ヨーロッパは既存の工場への導入を前提とした開発。 ・アメリカ、中国はロボットのための工場を作る。 https://www.youtube.com/watch?v=2hxFmwginMk
4 なぜロボットにLLMなのか? 従来のロボット開発だと、人間の常識を全て一から教えていた。 LLMを使うことで、常識を持った状態からの学習が可能になった。 画像から読み取れること ・天気は曇り ・場所は駅前 ・時計がある ・車が2台止まっている。一台はタクシー ・手前の横断歩道は渡れる
・柵は乗り越えられない
5 Google DeepMindの取り組み 2022年 RT-1:Transformerベースの模倣学習 2023年 RT-2:VLMモデルの採用 2023年 RT-X:ロボット向け大規模データセット 2025年
Gemini Robotics: Geminiベースのロボット向け基盤モデル
6 RT-1 https://robotics-transformer1.github.io/ 動画は四倍速 https://arxiv.org/pdf/2212.06817 ロボットの制御にTransformerを採用 13台のロボットを17ヶ月かけてデータを収集した。
7 RT-2 https://robotics-transformer2.github.io/ 動画は等倍 https://arxiv.org/pdf/2307.15818 RT-1の発展形。 VLMが採用されている。
8 RT-X https://robotics-transformer-x.github.io/ 動画は等倍 34の研究室から22種類のロボットのデータを収集。デ ータセットの共通化。 https://arxiv.org/pdf/2310.08864
9 Gemini Robotics 等倍アピール Geminiベースのロボット制御。 この動きはまず無理というレベルの制御をしている。 難易度の高いところ ・対象物が半透明 ・マニピュレーションしながら形が変化する。 ・狭いところに指や物を通さないといけない。これも半
透明かつ不定形。 ・双腕の制御 https://www.youtube.com/watch?v=m-G4- slYcGE&list=PLqYmG7hTraZC4Mx6pEKr6FVJehafA7vWE&index=16
10 Gemini Robotics ER https://storage.googleapis.com/deepmind-media/gemini-robotics/Gemini-Robotics-1-5-Tech-Report.pdf Gemini Robotics-ER Embodied Reasoning 人間のような思考を担当
Gemini Robotics ロボットのAction(制御) 担当 Google AI Studioから アクセス可能
11 まとめ Google DeepMind社からRT-1が発表されて3年でロボットのAI がめちゃくちゃ進化してます。 中国企業も負けてないので、毎月が驚きの連続。 こういう技術を趣味のロボットまで持っていきたい