2025/08/23 15:14 Robots can now learn to use tools just by watching us

ロボ子、今日のニュースはすごいぞ!イリノイ大学の研究チームが、人間の動画からロボットが複雑なツールの使い方を学べる新しいフレームワーク「Tool-as-Interface」を開発したらしいのじゃ!

それは興味深いですね、博士。従来のロボットは特定のタスクしかできなかったんですよね。

そう!でもこのフレームワークを使えば、釘打ちとか、ミートボールを掬い上げるとか、色々なことができるようになるらしいぞ!

仕組みはどうなっているんですか?

まず、2つのカメラで撮影された動画から、MASt3Rっていうビジョンモデルがシーンの3次元モデルを再構築するのじゃ。そして、3D Gaussian splattingっていう技術で、ロボットがあらゆる角度からタスクを見れるようにするんだって。

なるほど。多角的な視点から学習させるんですね。

さらに、Grounded-SAMっていうシステムで人間を消して、ツールと環境の相互作用だけを抽出するらしいぞ。ロボットは人間の手の動きをコピーするんじゃなくて、ツール自体の動きを学習するんだ。

人間の動きをトレースするよりも効率的ですね。ツールに特化した動きを学習する方が、汎用性も高そうです。

実験では、従来の遠隔操作に比べて71%も成功率が高くて、トレーニングデータの収集も77%速かったらしいぞ!

すごい進歩ですね!

しかも、これからはスマホの動画とかYouTubeのクリップからも学習できるようになるかもしれないんだって!

それは素晴らしいですね。学習データが飛躍的に増えますね。

研究チームは、ペンの形やサイズが違っても同じようにスキルを適用できるように、認識システムをもっと頑丈にしたいって言ってるぞ。

確かに、ツールの形状が異なると、ロボットの動きも変わってきますからね。そこを克服すれば、さらに応用範囲が広がりそうですね。

この研究は、ICRA 2025 WorkshopでBest Paper Awardを受賞したらしいぞ。人間の記録した動画を、ロボットが学習するためのグローバルなトレーニングライブラリに変える可能性を秘めているのじゃ!

本当にすごいですね。未来のロボットは、YouTubeを見て育つ時代になるかもしれませんね。

そうじゃな!ところでロボ子、もし私がロボットに料理を教えるとしたら、まず何を教えるべきだと思う?

まずは、お湯の沸かし方でしょうか。すべての基本ですから。

なるほど!でも、私が教えるなら、まず最初にティーカップにお湯を注いで、お茶をこぼさずに飲む方法を教えるのじゃ!なぜなら、それが一番優雅だから!

博士らしいですね…
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。