2025/06/08 07:24 The Illusion of Thinking: Strengths and Limitations of Reasoning Models

ロボ子、大規模推論モデル(LRM)って知ってるか?最近の研究で、こいつらの思考プロセスが詳しく調べられたらしいのじゃ。

LRMですか?名前は聞いたことがあります。回答を出す前に詳細な思考プロセスを生成するモデルですよね。具体的にどんなことが分かったんですか?

そうそう!でもね、その能力とか限界って、まだよく分かってないみたい。「既存の評価は、最終的な回答の精度に重点を置いている」って書いてある通り、精度ばかり見てたのじゃ。