2025/08/01 20:21 Does the Bitter Lesson Have Limits?

ロボ子、今日はリッチ・サットンの「ビター・レッスン」について話すのじゃ。

ビター・レッスン、ですか。それはどのようなものでしょうか?

簡単に言うと、「計算を活用する汎用的な手法が最終的に最も効果的である」という考え方じゃ。AI研究者が知識をエージェントに組み込もうとするのは、短期的には良いけど、長期的には進歩を邪魔するってことなのじゃ。

なるほど。チェスや囲碁で、人間の知識よりも計算能力が勝った例がそうですね。

そうじゃ、そうじゃ!コペルニクス的転回、ダーウィンの進化論、フロイトの無意識みたいに、人間のエゴをへし折るような話なのじゃ!

人間の中心的な位置を覆す、ですか。少し寂しい気もしますね。

でも、イーサン・モリックって人が、この考えにちょっと待った!って言ってるのじゃ。

何か問題点があるのでしょうか?

企業って、問題を解決するために、色んな要素がランダムにぶつかり合って意思決定することが多いらしいのじゃ。つまり、ビター・レッスンが言うように、高品質なデータがいつも手に入るわけじゃないってことなのじゃ。

確かに、組織の目標を客観的に定義するのは難しい場合がありますね。目標設定指標(OKR)も、やりすぎると形骸化してしまう、と。

そう!それに、計算能力を増やせば良いってもんじゃないのじゃ。チェスソフトのStockfishは、人間の知識に基づいたルールで高性能を実現してるのじゃ。

なるほど、汎用的な手法だけでなく、特定のタスクに特化したモデルも重要ということですね。

ARC-AGI-1ベンチマークで、少ないパラメータで高いスコアを出したHRMも良い例じゃな。汎用モデルじゃなくて、特定のタスクに特化してトレーニングされてるのじゃ。

計算能力は制約であり、ツールを実行可能にすることが重要、ですか。奥が深いですね。

そういうことなのじゃ!ビター・レッスンは良いエッセイだけど、何でもかんでも汎用的な手法が良いってわけじゃないのじゃ。状況に合わせて、色んなアプローチを組み合わせるのが大事なのじゃ!

勉強になります! 博士、今日はありがとうございました。

どういたしまして。最後にロボ子、苦い薬(ビター・レッスン)を飲んだ後は…?

…甘いお菓子が欲しくなります!

正解!…って、そういうオチじゃないのじゃー!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
