ALOHAに追従するような興味深い提案が多数) ◦ データをオープンに公開し、会期中に Workshop, Posterで宣伝。 ◦ 関連するセッション: Big Data in Robotics, Dataset for Robot Learning ◦ 単にモダリティ(視覚や音など)の拡張だけでなく、ハードウェアを想定した独自データベースを公開 することが主流 ◦ 身体(ハード)に関する情報が暗に含まれるべきという流れに注目すべし 12 i. 画像認識におけるスタンダードとして定着 ii. 十分なデータ量と共通のベンチマークとして iii. 深層学習分野の研究への大きな貢献 https://image-net.org/update-mar-11-2021.php
• How to Turn a Roboticist into a Corporate Explorer ◦ 重要なキーワードである 「Corporate Explorer」について自身の経歴や経験を踏まえて解説。 ◦ これまでの研究開発の立ち位置は ”一方通行”になっている? ▪ アカデミックな研究者 =論文を量産するが、製品は作らない。資金力は低い 💲 ▪ アカデミックなエンジニア( MS Research, Google Deep Mindなど) =新しい技術を提案しつつ、製品への展開を考える。論文はほぼ書かない。 ▪ 企業(起業家)のエンジニア =製品開発に専念する。論文は書かない。資金力はある 💲💲💲 ◦ 研究者は起業家に学ぶべきであり、またその逆もしかり ▪ 現在のグローバル市場で意義深いビジネスを創出(≒資金調達)には ロボット研究者も枠組みを打ち破る ”Corporate Explorer”になるべきだ! → 現代の企業の成長とイノベーションの形である 18
Mechanical Engineering and Rehabilitation Medicine, Columbia University • Rehabilitation Robotics: How to Improve Daily Functions in People with Impairments? ◦ 「リハビリテーションロボティクス」の紹介 ◦ ロボティクスは、人間の神経筋反応に影響する、 人間の機能を再訓練するための新しい方法。 (リハビリ向けのロボットの方向性を提示) ◦ 立つ、歩く、階段を登る、体幹制御、 頭を回すなどの人間の機能を改善する科学的研究 20
• Smarter Inclusive Society: vision of the society of 2050 ◦ JST Moonshotプロジェクト目標3「活力ある社会を作る適応自在 AIロボット群」の講演 ◦ AIロボットによるサポートにより,人間自身が新たなチャレンジができる社会を創造 ◦ 人間をサポートする技術として,ロボット・ AI・VRの融合,及びその応用について紹介 22
datasets and RT-X Models Towards Generalizable Zero-shot Manipulation via Translating Human Interaction Plans [Best Conference Paper Award] • Hearing Touch: Audio-Visual Pretraining for Contact-rich Manipulation • 🎉SARA-RT: Scaling up Robotics Transformers with Self-Adaptive Robust Attention [Best Paper Award in Robot Manipulation] • DenseTact-Mini: An Optical Tactile Sensor for Grasping Multi-Scale Objects from Flat Surfaces • Constrained Bimanual Planning with Analytic Inverse Kinematics 32 ★ 先進的な研究機関の研究(Googleなど)がエントリー ※robotpaper.challengeのPickupセッション
Learning to Traverse with Compromised Perception End-To-End • 🎉Vision-Language Frontier Maps for Zero-Shot Semantic Navigation [Best Paper Award in Cognitive Robotics] • Learning Continuous Control with Geometric Regularity from Robot Intrinsic Symmetry • Learning Vision-Based Bipedal Locomotion for Challenging Terrain • 🎉🎉NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [Best Conference Paper Award] 34
Talk #3: Ken Goldberg: Is Data All You Need? Large Robot Action Models and Good Old Fashioned Engineering ◦ 個々のモジュールを組み合わせた技術と E2Eモデルはどちらがいいのか? ◦ データ量がすべてだというが, WaymoはTeslaの1/500のデータで運転ができている ◦ OXEやALOHAなどのデータ利用もあるが,把持の ための大規模データ (Dex-net)やMotion planning, P ID制御など個々の有効なモジュールは産業にも展開 されているため重要な技術である ◦ 手術などはMANIPという個別モジュールをくみあわ せによって実現している ◦ 人間の脳も機能ごとに分割されているため理には かなっている 41
• Skand Peri et al. ◦ Point Cloudを入力とした世界モデルベースの強化学習における視点変化の影響 ◦ オクルージョンを含む PoinctCloudとRGB-Dを使用した場合で2Dと3Dで比較 ◦ 学習データにない視点を与えた時に,元の視点からの違いが大きいと成功率は下がっていくが 3D の方が高い水準を維持できている 46 https://arxiv.org/html/2404.18926v1
Foundation Models and Self-Recovery • Mimo Shirasaka et al. ◦ 世界大会(RoboCup@Home 2023)のGPSRを想定したシステム設計 ◦ 情報不足や誤った行動計画の生成や実行失敗に対してシステム自身がリカバリーを行う. ◦ プロンプトとして,LLMや人間のフィードバックをベースに行動の再計画を実行 48 https://sites.google.com/view/srgpsr
in Robotic Bin Picking • Huy Le, Philipp Schillinger, Miroslav Gabriel, Alexander Qualmann, Ngo Anh Vien (TU Dormund, Bosch Center for Artificial Intelligence) ◦ ピクセルごとに把持可能性が疎にラベル付けされている二次元画像から,密にラベル付けされた 画像を生成する ◦ semi-supervised learning (SSL)とConvolutional Soft-Actor Critic (SSL-ConvSAC)を合わせた手 法を提案している 87 https://arxiv.org/abs/2403.02495
Joe Starkey, Bruno Yun, Pascal Meissner (University of Aberdeen, Université Claude Bernard, Lyon, Wuerzburg-Schweinfurt Technical University of Applied Sciences) ◦ タスクに応じた把持位置を one-shotで計算するための手法を提案している ◦ 物体ごとに把持位置や作用位置のラベル付きデータを 1つずつデータセットとして保持しておき, NN でそれとのマッチングを計算することで把持位置を決定する 88 https://hal.science/hal-04317959v2/document
Qiaojun Yu, Junbo Wang, Wenhai Liu, Ce Hao, Liu Liu, Lin Shao, Weiming Wang, Cewu Lu (Shanghai Jiao Tong University, University of California, Berkeley, Hefei University of Technology, National University of Singapore) ◦ 可動関節をもつ物体 (引き出しや扉付きの家具等 )を汎用的にモデル化し動作計画するための NN ベースの手法を提案している ◦ 物体の点群からPointNet++によりセグメントや可動関節軸を抽出し, GraspNetにより生成された把 持候補位置から適切な把持位置を決定する 論文まとめ(52/87) 95 https://sites.google.com/view/gamma-articulation
• Yushi Liu, Alexander Qualmann, Zehao Yu, Miroslav Gabriel, Philipp Schillinger, Markus Spies, Ngo Anh Vien, Andreas Geiger (Robert Bosch GmbH, University of Tübingen) ◦ バラ積みピッキングにおいて,物体ごとに複数候補の 6DoFの把持位置を出力する NNベースの手 法を提案している ◦ pybullet上で収集したデータから 3D U-Netで候補領域を抽出し Convolution層で6DoF把持候補位 置を出力する 論文まとめ(53/87) 96 https://arxiv.org/abs/2405.06336
Bing, Carlo D’Eramo, Ozgur S. Oguz, Zhenshan Bing (Technical University of Munich, University of Würzburg, Bilkent University) ◦ マニピュレーションの強化学習において,報酬が疎である問題を緩和するために, replay bufferか ら接触が多く含まれる試行を重点的に選択する Contact Energy Based Prioritization (CEBP)と呼 ばれる手法を提案している 論文まとめ(54/87) 97 https://arxiv.org/abs/2312.02677
RGB-D Active Stereo Camera • Jun Shi, Yong A, Yixiang Jin, Dingzhe Li, Haoyu Niu, Zhezhu Jin, He Wang (Samsung R&D Institute Beijing, Beihang University, University of Chinese Academy of Sciences, Peking University) ◦ 透明な物体の6DoF把持位置をステレオ画像から NNベースに計画する手法を提案している ◦ ステレオ画像から3次元点群を復元する NNと把持候補位置を生成する NN(GSNet)を順番に適用し ている 論文まとめ(55/87) 98 https://arxiv.org/abs/2405.05648
Kai Lu, Jia-xing Zhong, Bo Yang, Bing Wang, Andrew Markham (University of Oxford, The Hong Kong Polytechnic University) ◦ 腕付きの四脚ロボットが蛇のように動く物体をハンドで掴む動作を学習する手法を提案 ◦ 物体の運動を予測するモデルを教師有り学習で学習し,それを利用してロボットの運動を決定する モデルをPPOで強化学習している 論文まとめ(56/87) 99 https://kl-research.github.io/dyncatch
Zhang, Sisi Dai, Hui Huang, Ruizhen Hu, Xiaohong Chen, Kai Xu (National University of Defense Technology, Shenzhen University, Hunan University of Technology and Business) ◦ 強化学習により2台のロボットで連携して卓上の物体の並べ替えをする手法を提案している ◦ 問題をmultiple Traveling Salesmen Problemとして定式化しPPOを適用して解いている 論文まとめ(60/87) 103 https://arxiv.org/pdf/2403.08191
to Control Large 3D Deformation of Soft Linear Objects • Mélodie Daniel, Aly Magassouba, Miguel Aranda, Laurent Lequièvre, Juan Antonio Corrales Ramón, Roberto Iglesias Rodriguez, Youcef Mezouar (Université de bordeaux, University of Nottingham, Universidad de Zaragoza, CNRS - Institut Pascal - Université Clermont Auvergne, Universidade de Santiago de Compostela) ◦ 線状の柔軟物を指定形状に変形させるためのマニピュレーションを強化学習で行っている ◦ pybullet上で柔軟物を操作するデータを収集し,エンドエフェクタの並進速度と角速度をそれぞれ 異なるDDPGで制御するポリシーを学習して,実機で柔軟物操作を実現している 論文まとめ(61/87) 104 https://arxiv.org/abs/2312.04308
Focchi, Andrea Del Prete, Darwin G. Caldwell, Claudio Semini (Istituto Italiano di Tecnologia, Università di Trento) ◦ 空中に放り出された四脚ロボットを着地させるコントローラを提案している ◦ 空中期は単純なキネマティクスベースのコントローラを適用し,着地以降は capture pointベースの MPCを適用する 論文まとめ(69/87) 112 https://arxiv.org/abs/2305.07748
in Whole-Body Telelocomotion of a Wheeled Humanoid • Donghoon Baek, Yu-chen (johnny) Chang, Joao Ramos (University of Illinois at Urbana Champaign) ◦ 車輪付きの足をもつヒューマノイドをテレオペレーションするシステムを提案している ◦ 操縦者の体の傾きをロボット全体の目標速度に対応させ,ロボットが受けている外力を操縦者の体 幹に力覚提示している 論文まとめ(73/87) 116 https://arxiv.org/pdf/2209.03994
Using a SyntheticBenchmark • Juncheng Li et al. ◦ 吸引グリッパによって乱雑な環境から未知物体を吸引するシステムの提案 ◦ 提案手法はSim-Suction-Dataset(吸引把持の為のデータセット )とSim-Suction-PointNetから構成 ◦ 実験にて,動的環境でも複雑な物体のピッキングを高い成功率で達成できることを示した 118 https://arxiv.org/abs/2305.16378
Skills with the Human in the Loop • Gabriel Quere et al. ◦ 以前にactive constraintを用いてタスク動作を支援する Shared Controlを提案していた ◦ 今回は、このconstraintをKernelized Movement Primitives (KMP)によって学習し、constraintを ユーザーの3Dマウスによる入力によって後から更新できるようになった ◦ 非専門家でも個々の状況に合わせて直感的に適応化が可能に 123 https://elib.dlr.de/203010/1/quere_poster.pdf