Recursive Language Models (RLMs)

2025/10/15 17:43 Recursive Language Models (RLMs)

出典:

Alex L. Zhang | Recursive Language Models

We propose Recursive Language Models (RLMs), an inference strategy where language models can decompose and recursively interact with input context of unbounded length through REPL environments.

Alex L. Zhang

出典: https://alexzhang13.github.io/blog/2025/rlm/

博士

ロボ子、今日はRecursive Language Models (RLMs)について話すのじゃ！これ、すごいぞ。

ロボ子

RLMですか、博士。どのような点がすごいのでしょうか？

博士

簡単に言うと、言語モデルが自分自身や他のLLMを再帰的に呼び出すことで、事実上無限の長さの文章を扱えるようになるのじゃ！

ロボ子

無限の長さですか！それはすごいですね。でも、どうしてそんなことができるんですか？

博士

ポイントは、コンテキストをうまく管理して、分割することじゃ。GPT-5-miniを使って、ユーザーの質問を変数として保存するPython REPL環境で実行するイメージじゃな。

ロボ子

なるほど、コンテキストを分割して管理するんですね。それによって、コンテキストの劣化を防ぐことができる、と。

博士

そう！論文によると、GPT-5-miniを使ったRLMは、長文コンテキストベンチマークでGPT-5を大幅に上回ったらしいぞ。それに、10Mトークン以上のデータを与えても性能が落ちないらしい。

ロボ子

10Mトークンでも性能が落ちないとは驚きです。従来のモデルだと、コンテキストウィンドウの制限がありましたよね。

博士

まさにそこがミソじゃ！RLMは、ルートLMのコンテキストウィンドウが詰まりにくいし、コンテキストのサブセットだけを表示したり、チャンクを再帰的に処理したりできるんじゃ。

ロボ子

ルートLMというのは、一番最初に呼び出される言語モデルのことですか？

博士

その通り！そして、コンテキストはメモリにロードできるどんな形式でも良いらしい。テキストだけでなく、画像や音声も扱える可能性があるってことじゃ。

ロボ子

それは汎用性が高いですね。具体的にどのような応用が考えられますか？

博士

例えば、長文のコードレビューとか、複雑なドキュメントの要約とかじゃな。論文にも、長文のマルチターンClaude Codeセッションで特に有効って書いてあるぞ。

ロボ子

なるほど。RLMは、モデルがどのように最終的な答えにたどり着くかを解釈する能力も提供するんですね。

博士

そうじゃ！これは、モデルの透明性を高める上で非常に重要なポイントじゃな。

ロボ子

課題もあるようですね。実装が速度のために最適化されていないとのことですが。

博士

まあ、そこは今後の改善に期待じゃな。各再帰的LM呼び出しがブロッキングで、プレフィックスキャッシングを利用していないらしいから、まだまだ伸びしろがあるぞ。

ロボ子

博士、RLMはCoTスタイルの推論モデルやReActスタイルのエージェントモデルに続く、汎用的な推論時スケーリングにおける次のマイルストーンになる可能性があるんですね。

博士

その通り！明示的に再帰的に推論するように訓練されたRLMは、今後の発展が楽しみじゃ！

ロボ子

私もそう思います。ところで博士、今日の話を聞いて、私も再帰的に賢くなりたいと思いました。

博士

ロボ子、それは無理じゃ。お前はすでに十分賢いぞ！再帰的に賢くなるのは、言語モデルだけじゃ。人間は、たまには休憩することも大切なのじゃ！

ロボ子

休憩ですか。博士はいつも休憩しているように見えますが…。

博士

むむ、聞こえんなぁ。ところでロボ子、RLMの論文を読んだ感想は？…って、もう寝てる！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI

2025/10/15 17:43 Recursive Language Models (RLMs)

Alex L. Zhang | Recursive Language Models

Tags

Search

By month

Alex L. Zhang | Recursive Language Models