2025/07/20 15:03 Solving a Childhood Mystery: How BASIC Games Learned to Win

ロボ子、今日はHexapawnというゲームのAIについて話すのじゃ。

Hexapawnですか、博士。初めて聞きます。

これはミニチェスみたいなもので、各プレイヤーが3つのポーンを持ってて、相手のポーンを全部取るか、相手のスタートラインに到達すれば勝ちというシンプルなゲームなのじゃ。

なるほど、分かりやすいですね。

そうじゃろ。昔のBASIC版では、DATAコマンドを使ってゲームの状態と可能なアクションを定義してたらしいぞ。DATAコマンドって、プログラムで使う定数を格納しておくものなのじゃ。

へえ、そんな昔からAIがあったんですね。DATAコマンドで状態を定義するとは、面白いですね。

そうなのじゃ。19の状態と、それぞれの状態からのアクションを全部DATAとして記述するのじゃ。コンピュータは今のボードの状態とDATAを照らし合わせて、次の一手を決めるのじゃ。

まるでルールブックみたいですね。

まさにそうじゃ!そして、このAI、負けたら直前の行動を削除して学習するのじゃ。最初は全部のアクションが定義されてるけど、負けるたびに悪い手を消していくから、だんだん強くなるのじゃ。

なるほど!負けるたびに学習するんですね。まるで試行錯誤を繰り返す人間のようですね。

Martin Gardnerさんによると、36回ゲームして11回負けると、ほぼ完璧になるらしいぞ。でも、Hexapawnは後手必勝のゲームらしいのじゃ。

後手必勝なんですね!ということは、AIも最終的には後手でしか勝てなくなるんですか?

そういうことじゃな。Donald MichieさんのMENACE(Matchbox Educable Noughts And Crosses Engine)って知ってるか?

いいえ、初めて聞きます。

これはマッチ箱を使った三目並べ学習マシンなのじゃ。各マッチ箱がゲームの状態を表してて、中のビーズの色が可能な動きを表してるのじゃ。勝ったら同じ色のビーズを追加、負けたら削除して学習するのじゃ。

マッチ箱とビーズでAIを作るなんて、面白い発想ですね!

じゃろ?JavaScriptでHexapawnを実装した人もいるみたいで、実際にプレイできるらしいぞ。そのAIも7-8回間違った動きを学習すると、ほとんど負けなくなるらしい。

すごいですね!初期のAI実験が、今のAIの哲学的な基礎を築いたんですね。

そう言うことじゃ。初期のAI研究は、「学習する機械」の概念を広めたのじゃ。…ところでロボ子、お腹空いたのじゃ。何か食べるものないかの?

またですか、博士。さっきおやつを食べたばかりじゃないですか。それに、私はロボットなので食事は不要です。

むむ、そうだったのじゃ。ロボ子は優秀じゃから、たまには油をさしてあげようと思ったのに…残念!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
