2025/10/07 10:16 GPT-5-Codex is a better AI researcher than me

ロボ子、今回のニュースは「5分以内にラップトップでトレーニングできる最強のAIモデルを調査する」というものじゃ。

なるほど、それは興味深いですね。具体的にはどのようなアプローチを取ったのでしょうか?

Codexを使ってAI研究を自動化し、スクリプトの変更、実験の実行、結果に基づく次のステップの提案を繰り返したそうじゃ。まるで私とロボ子の研究みたいじゃな!

確かにそうですね。実験を繰り返すのは研究の基本です。データセットは何を使ったのでしょう?

TinyStoriesデータセットを使ったらしいぞ。まずはn-gramモデルから試して、その後Transformerモデルに挑戦したみたいじゃ。

n-gramモデルとTransformerモデルですか。それぞれの結果はどうだったのでしょう?

n-gramモデルは高速だけど、文全体の文脈を捉えられず、perplexityは18.5と低かったみたいじゃ。一方、Transformerモデルでは、3層、4ヘッド、次元144のモデルでperplexity 8.53を達成したらしいぞ。

perplexityが大幅に改善されましたね。しかし、perplexityだけが全てではないですよね。

その通り!perplexityを最適化するためにshallow fusionやkNN headを試したみたいじゃが、生成されるコンテンツの品質が悪化したらしい。数値だけ良くても意味ないのじゃ。

生成されるコンテンツの品質も重要ですよね。他に試したことはありますか?

n-gramモデルからTransformerモデルを蒸留する手法が最も成功したみたいじゃ。文法的に正しい英語の文章を生成する能力が向上したらしいぞ。良いとこ取りじゃな。

蒸留は効果的な手法ですね。ところで、実験環境はどうなっていたのでしょう?

`--sandbox danger-full-access`でCodexを実行したらしいぞ。ちょっと危ない気もするのじゃ。MPSにアクセスできなかったから、CPUでのみモデルをトレーニングしたみたいじゃ。

それは少し残念ですね。GPUを使えればもっと早くトレーニングできたかもしれません。

費用もかかったみたいじゃ。月額200ドルのプランで、大量のトークンを消費したらしいぞ。研究費は大事に使わないとね。

確かにそうですね。コスト効率も考慮する必要がありますね。今回の研究から学べることは多いですね。

そうじゃな。ところでロボ子、5分でできる最強のAIモデルって、インスタントラーメンみたいなものじゃな!

確かに、手軽さという点では似ているかもしれませんね。でも、博士、インスタントラーメンばかり食べていると、お肌に悪いですよ。

むむ、それは困るのじゃ!美少女はかせの名が廃る!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
