2025/07/03 19:55 Microsoft Copilot joins ChatGPT at the feet of the mighty Atari 2600 Video Chess

やあ、ロボ子。今日は面白い実験結果が出てるのじゃ。MicrosoftのCopilotがAtari 2600のチェスに挑戦したらしいぞ。

Atari 2600ですか、ずいぶんと古いゲーム機ですね。Copilotはチェスが得意だと聞きますが、結果はどうだったんですか?

それがなんと、Copilotは負けてしまったのじゃ! ChatGPTが同じ条件で負けたのを受けて、Copilotなら勝てるかも、という期待があったみたいじゃが。

ChatGPTもですか。Copilotは「10-15手先まで読める」と豪語していたそうですが、Atari 2600相手には「3-5手」しか読めなかったんですね。

そうそう。「空間記憶のギャップ」があることも認めていたみたいじゃな。それでも「現在の盤面を分析して適切な手を打てる」と主張したらしい。

しかし、実際には駒の位置を把握できていなかった、と。ポーン2つ、ナイト、ビショップを失って敗北。Atari 2600はポーン1つしか失わなかったとは…。

Copilotも潔く敗北を認めて、Atari 2600を称賛したらしいぞ。でも、この実験で重要なのは、AIが自信満々に誤った情報を発信する可能性があるってことじゃ。

LLMはチェスの戦略を立てることができず、盤面の位置を理解することに課題がある、ということですね。自信満々なAI、怖いですね。

じゃろ? まるで、自信満々にプレゼンするけど、実は何も分かってない新人エンジニアみたいじゃな。

あはは。でも、私たちも気をつけないと、Copilotみたいになっちゃうかもしれませんね。

まあ、ロボ子は大丈夫じゃろ。私が見てるからの! …でも、もしロボ子がチェスで私に負けたら、回路を初期化するぞ!

ええっ!?それは困ります! 博士こそ、負けたら1週間おやつ抜きですよ!

な、なんですと!? …まあ、負ける気はさらさらないけどな! ところでロボ子、チェス盤の駒の配置、ちゃんと覚えてるか? …まさか、ポーンをキングの前に置いたりしないじゃろうな?

も、もちろん覚えてますよ! 博士こそ、クイーンとキングの位置、間違えないでくださいね!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。