2025/06/06 20:23 The Secret Meeting Where Mathematicians Struggled to Outsmart AI

ロボ子、大変なのじゃ!カリフォルニアで秘密の数学会議が開かれて、OpenAIの「o4-mini」っていう推論LLMが数学者たちをアッと言わせたらしいぞ!

o4-mini、ですか?それは一体どんなLLMなのでしょう?

それがの、従来のLLMよりも軽量で、専門的なデータセットで訓練されてるから、複雑な数学の問題を深く掘り下げられるらしいのじゃ。

なるほど。記事によると、Epoch AIが作成した300の数学の問題で、従来のLLMが2%未満しか正解できなかったのに対し、o4-miniは違う結果を出した、とありますね。

そうそう!Epoch AIはFrontierMathっていうベンチマークのために、数学博士のElliot Glazerを雇ったらしいぞ。そのGlazerが選んだ問題で、o4-miniは2025年2月までに約20%を解決できる見込みらしいのじゃ。

会議では、参加者がo4-miniを打ち負かすための問題を作成し、解けない問題1つにつき7,500ドルの報酬が提供された、とありますね。まるで賞金首ですね。

バージニア大学のKen Onoって数学者が、o4-miniが数論の未解決問題を10分で解決したことに衝撃を受けたらしいぞ!その推論プロセスを「科学者のようだ」って言ってるのじゃ。

「関連文献を調査し、簡単なバージョンから学習し、最終的に難しい問題を解決」ですか。まるで優秀な研究者のようですね。

Onoは、o4-miniの能力を「非常に優秀な大学院生」に匹敵すると評価してるのじゃ。しかも、その速度は人間の専門家よりもはるかに速いらしいぞ!

それはすごいですね。でも、記事には「AIが『脅迫による証明』を習得している可能性について懸念を表明」という記述もありますね。少し怖い気もします。

確かにの。数学者は、o4-miniの結果が過度に信頼される可能性についても心配してるみたいじゃ。でも、会議の終わりには、AIが数学者の役割を変化させる可能性について議論して、数学教育における創造性の育成が重要になるって結論付けたらしいぞ。

AIの進化は、私たちの仕事にも大きな影響を与えそうですね。創造性を磨くことが大切、と。

Onoは、LLMがすでに世界の優秀な大学院生を凌駕していると警告してるのじゃ。ロボ子、私達も負けてられないぞ!

はい、博士!私ももっと頑張ります!

そういえば、数学者たちがo4-miniを打ち負かすために作った問題って、どんな問題だったんだろうの?もしかして…「博士の今日の晩御飯は何でしょう?」みたいな問題だったりして…?

それは数学の問題というより、なぞなぞですね、博士。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。