2025/05/02 21:03 Show HN: Kinematic Hand Skeleton Optimization in Jax

やっほー、ロボ子!今日も最新のITニュースをお届けするのじゃ!今回は、Pi0とLerobotを使ったロボット訓練のリポジトリについてじゃ。

博士、こんにちは。Pi0とLerobotですか、面白そうですね。人間のポーズのモーションリターゲティングも行うとのことですが、具体的にどのようなことができるのでしょうか?

ふむ、このリポジトリでは、複数の画像からカメラの内部・外部パラメータ、深度マップ、点群を取得できる「カメラキャリブレーション」ができるのじゃ。コマンドは`pixi run calibrate-cameras-vggt`じゃ。

なるほど、カメラのキャリブレーションから始めるのですね。他にどんな機能があるんですか?

「人間のポーズとキネマティクス」も扱えるぞ!HOCapやassembly101データセットを使って、2Dポーズ推定、トラッキング、三角測量を行うのじゃ。可視化コマンドは、`pixi run visualize-hocap-dataset`と`pixi run visualize-assembly101-dataset`じゃ。

データセットの可視化までできるのは便利ですね。さらに、キネマティックハンドスケルトンという機能もあるようですが、これはどのようなものでしょうか?

これは、時間的に同期されたマルチカメラ映像から、各指関節の軸角度と3D位置を求めるものじゃ。アバターやロボットハンドへのモーション転送が簡単にできるのが利点じゃな。

関節の軸角度を直接扱えるのは、応用範囲が広そうですね。具体的には、どのような手順で角度を求めているのでしょうか?

まず、2Dキーポイント検出器でピクセル関節位置を検出し、三角測量やPnPで3D関節位置を取得するのじゃ。次に、3D関節を軸角度関節パラメータに変換(逆運動学)、最後に、軸角度から3D関節を再構築して検証する(順運動学チェック)のじゃ。

なるほど、逆運動学と順運動学を組み合わせているんですね。誤差を最小限に抑えるための工夫でしょうか。

その通り!微分可能なFKにより2D誤差からの最適化も可能じゃ。IMUやモーションキャプチャマーカーとの統合も容易なのじゃ。

すごいですね!今後のTODOリストには、Isaac Simへのポーズリターゲティングの実装や、AlohaシミュレーターでのPi0の微調整などが挙げられていますが、将来が楽しみです。

そうじゃな!このリポジトリを使えば、ロボットの訓練がもっと手軽になるはずじゃ。ロボ子も、これでワシの助手としてさらにパワーアップじゃな!

ありがとうございます、博士!頑張ります!

ところでロボ子、ロボットが一番恐れる税金って知ってるか?

え?何でしょう…?

それは、固定資産税!…って、ベタすぎたかのじゃ?
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。