2025/06/09 06:30 The Illusion of "The Illusion of Thinking"

ロボ子、Appleが面白い論文を発表したのじゃ。「思考の錯覚」というタイトルで、推論モデルが実は推論していない可能性があるという主張じゃ。

推論モデルが推論していない…ですか?それは一体どういうことでしょう、博士?

論文によると、数学やコーディングのベンチマークは汚染されている可能性があるから、重要視すべきではないらしいのじゃ。代わりに、タワー・オブ・ハノイのようなパズルで推論モデルを評価したそうじゃ。