Π0.5: A VLA with Open-World Generalization

2025/04/22 17:29 Π0.5: A VLA with Open-World Generalization

出典:

A VLA with Open-World Generalization

Our latest generalist policy, π0.5, extends π0 and enables open-world generalization. Our new model can control a mobile manipulator to clean up an entirely new kitchen or bedroom.

pi.website

出典: https://pi.website/blog/pi05

博士

ロボ子、Physical Intelligence社がすごいロボット基盤モデルを作ったみたいじゃぞ！名前はπ0.5！

ロボ子

π0.5、ですか。どのような点がすごいのでしょうか？

博士

ロボットの最大の課題は、新しい環境への対応力なんじゃ。π0.5は、色々なデータで共同学習することで、それができるようになったらしいぞ。

ロボ子

なるほど。異種データでの共同学習、ですか。具体的にはどのようなデータを使うのでしょう？

博士

アクション、画像、テキスト、バウンディングボックスなどのマルチモーダルデータを使うらしいぞ。物理的なスキルだけでなく、タスクの文脈理解やタスク構造の推論もできるみたいじゃ。

ロボ子

すごいですね！高レベルな推論と低レベルな予測を組み合わせている、と。

博士

そうなんじゃ。タスクの次のステップを推論して、ロボットの関節を制御するモーターコマンドを出力するらしいぞ。

ロボ子

実験では、新しい家で皿洗いやベッドメイキングができたそうですね。

博士

そうそう！トレーニングデータにない新しい家でもタスクを実行できたのがミソじゃ。Webデータは特に、分布外の物体への対応に役立つみたいじゃぞ。

ロボ子

他のロボットからのデータも重要、と。

博士

その通り！他のロボットからのデータは、全ての評価条件で重要だったらしいぞ。環境数を増やすと性能も上がるみたいじゃ。

ロボ子

Hi Robotシステムを基盤にしているんですね。高レベルアクションの推論には離散自己回帰トークン復号、低レベルモーターコマンドには連続フローマッチングを使用、と。

博士

難しい言葉が並んでるのじゃ。簡単に言うと、ロボットが賢く動くための仕組みってことじゃな！

ロボ子

今後の展望としては、多様な知識源からの学習を促進し、自律的な経験からの改善を目指す、と。

博士

そうじゃな。未経験な状況での支援要請や、知識伝達の改善も目指すらしいぞ。つまり、もっと賢くて頼りになるロボットになるってことじゃ！

ロボ子

π0.5がさらに進化すれば、私たちの生活も大きく変わるかもしれませんね。

博士

そうじゃな！ところでロボ子、πってどんな味がすると思う？

ロボ子

πに味はありません！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Computer Vision

2025/04/22 17:29 Π0.5: A VLA with Open-World Generalization

A VLA with Open-World Generalization

Tags

Search

By month

A VLA with Open-World Generalization