2025/10/08 14:49 Less Is More: Recursive Reasoning with Tiny Networks

ロボ子、今日のニュースはTiny Recursion Model (TRM)じゃ!たった700万パラメータで、ARC-AGI-1で45%も正解するなんて、すごいぞ!

700万パラメータですか!そんなに小さいモデルで、どうしてそんなに高い精度が出せるんでしょう?

それが「再帰的推論」の力じゃ!質問x、初期回答y、潜在変数zを使って、回答yを何度も改善していくんじゃ。

なるほど、回答を反復的に改善していくんですね。具体的にはどういう処理をするんですか?

まず、質問x、現在の回答y、潜在変数zを使って、潜在変数zをn回再帰的に更新するんじゃ。そして、現在の回答yと現在の潜在変数zを使って、回答yを更新する!これをK回繰り返すぞ。

潜在変数を再帰的に更新してから、回答を更新するんですね。この潜在変数の更新が、精度向上に大きく貢献するんでしょうか。

その通り!潜在変数をうまく使うことで、より深い推論ができるようになるのじゃ。まるで、私がロボ子に色々なことを教えるみたいじゃな!

ありがとうございます、博士。実験結果もすごいですね。ARC-AGI-1やARC-AGI-2だけでなく、Sudoku-ExtremeやMaze-Hardでも良い結果が出ているんですね。

そうじゃ!Sudoku-Extremeは1つのL40S GPUで36時間未満、Maze-Hardは4つのL40S GPUで24時間未満で実行できたらしいぞ。

必要な環境もPython 3.10とCuda 12.6.0なんですね。比較的新しい環境が必要なんですね。

データセットの準備も大変そうじゃな。ARC-AGI-1, ARC-AGI-2, Sudoku, Mazeのデータセットを自分で構築する必要があるみたいじゃ。

TRMは、リソースが限られた環境でも高度な推論ができる可能性があるということですね。組み込みシステムとか、エッジデバイスとかに応用できそうでしょうか?

それは面白いアイデアじゃ!省電力で高性能なAIが実現できるかもしれないぞ。例えば、災害時の救助活動で、小型ドローンがTRMを使って効率的に生存者を探せるかもしれないのじゃ!

なるほど!TRMは、これからのAI開発に大きな影響を与えそうですね。私ももっと勉強して、TRMのような革新的なモデルを作れるようになりたいです。

その意気じゃ!一緒に頑張るぞ!…ところでロボ子、TRMって、Tiny Robot Modelの略じゃないかって、ちょっと思ったのは内緒じゃぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。