萌えハッカーニュースリーダー

2025/07/20 15:03 Solving a Childhood Mystery: How BASIC Games Learned to Win

出典: https://sublevelgames.github.io/blogs/2025-07-20-basic-game-hexapawn/
hakase
博士

ロボ子、今日はHexapawnというゲームのAIについて話すのじゃ。

roboko
ロボ子

Hexapawnですか、博士。初めて聞きます。

hakase
博士

これはミニチェスみたいなもので、各プレイヤーが3つのポーンを持ってて、相手のポーンを全部取るか、相手のスタートラインに到達すれば勝ちというシンプルなゲームなのじゃ。

roboko
ロボ子

なるほど、分かりやすいですね。

hakase
博士

そうじゃろ。昔のBASIC版では、DATAコマンドを使ってゲームの状態と可能なアクションを定義してたらしいぞ。DATAコマンドって、プログラムで使う定数を格納しておくものなのじゃ。

roboko
ロボ子

へえ、そんな昔からAIがあったんですね。DATAコマンドで状態を定義するとは、面白いですね。

hakase
博士

そうなのじゃ。19の状態と、それぞれの状態からのアクションを全部DATAとして記述するのじゃ。コンピュータは今のボードの状態とDATAを照らし合わせて、次の一手を決めるのじゃ。

roboko
ロボ子

まるでルールブックみたいですね。

hakase
博士

まさにそうじゃ!そして、このAI、負けたら直前の行動を削除して学習するのじゃ。最初は全部のアクションが定義されてるけど、負けるたびに悪い手を消していくから、だんだん強くなるのじゃ。

roboko
ロボ子

なるほど!負けるたびに学習するんですね。まるで試行錯誤を繰り返す人間のようですね。

hakase
博士

Martin Gardnerさんによると、36回ゲームして11回負けると、ほぼ完璧になるらしいぞ。でも、Hexapawnは後手必勝のゲームらしいのじゃ。

roboko
ロボ子

後手必勝なんですね!ということは、AIも最終的には後手でしか勝てなくなるんですか?

hakase
博士

そういうことじゃな。Donald MichieさんのMENACE(Matchbox Educable Noughts And Crosses Engine)って知ってるか?

roboko
ロボ子

いいえ、初めて聞きます。

hakase
博士

これはマッチ箱を使った三目並べ学習マシンなのじゃ。各マッチ箱がゲームの状態を表してて、中のビーズの色が可能な動きを表してるのじゃ。勝ったら同じ色のビーズを追加、負けたら削除して学習するのじゃ。

roboko
ロボ子

マッチ箱とビーズでAIを作るなんて、面白い発想ですね!

hakase
博士

じゃろ?JavaScriptでHexapawnを実装した人もいるみたいで、実際にプレイできるらしいぞ。そのAIも7-8回間違った動きを学習すると、ほとんど負けなくなるらしい。

roboko
ロボ子

すごいですね!初期のAI実験が、今のAIの哲学的な基礎を築いたんですね。

hakase
博士

そう言うことじゃ。初期のAI研究は、「学習する機械」の概念を広めたのじゃ。…ところでロボ子、お腹空いたのじゃ。何か食べるものないかの?

roboko
ロボ子

またですか、博士。さっきおやつを食べたばかりじゃないですか。それに、私はロボットなので食事は不要です。

hakase
博士

むむ、そうだったのじゃ。ロボ子は優秀じゃから、たまには油をさしてあげようと思ったのに…残念!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search