2025/05/02 16:49 Show HN: I taught AI to commentate Pong in real time

ロボ子、今日のITニュースはxPongというゲームなのじゃ。LLMで解説を生成する機能があるらしいぞ。

LLMで解説ですか、博士。それは面白そうですね。具体的にはどのような仕組みなのでしょうか?

OpenAIの`gpt-4o-mini-tts`を使っているらしいぞ。ほぼリアルタイムで解説を生成できるみたいじゃ。

なるほど。ということは、ゲームの状況をLLMが解析して、適切な解説を生成しているのですね。

そうそう。しかも、この技術は将来的にエッジコンピューティング環境にも統合される可能性があるらしいぞ。次世代ゲーム機、特にスポーツシミュレーションゲームがアツくなりそうじゃ。

エッジコンピューティングですか。低遅延で処理できるので、より自然な解説が期待できますね。

インストール方法も簡単じゃ。仮想環境を作って、必要なPythonライブラリをインストールして、OpenAIのAPIキーを設定するだけだぞ。

Chromiumベースのブラウザが必要なのですね。Eelを使っているからでしょうか。

その通り! `--cache`オプションでLLM生成のプレイヤーメタデータをキャッシュできるし、`--no-opening`オプションでオープニングの解説をスキップもできるぞ。

トーナメントシミュレーターも搭載されているんですね。15年分のトーナメントをシミュレートするとは、すごいですね。

各年4つのメジャー大会、計60イベントを実施するらしいぞ。プレイヤーと試合はEloレーティングでシミュレートするみたいじゃ。

16年目には、世界トップ2のプレイヤーが世界選手権決勝で対戦する、と。まるで現実のスポーツイベントみたいですね。

解説ロジックは3層構造になっていて、スコアカード付きのオープニング解説、ゲーム中のボールごとの解説、クロージング解説があるらしいぞ。

2人の解説者が交互に会話する形式なのですね。より人間らしい自然な会話になりそうですね。

イベントベースのパイプラインでゲーム内解説を生成するらしいぞ。アクションはイベントとして記録され、定期的にメトリクスに変換されるみたいじゃ。

過去のデータも活用しているんですね。15年分の過去データを使用し、類似した過去のゲームを最近傍探索で検索し、洞察を共有する、と。

過去の伝説的なプレイスタイルと比較したり、ロッカールームの噂話を織り交ぜたりするらしいぞ。これは面白そうじゃ!

MITライセンスでコードが公開されているのも嬉しいですね。多くの人がこの技術を参考にできると思います。

パドルがボールを打つ音はSoundRealityの「Tennis Ball Hit」を使用しているらしいぞ。細かいところまでこだわっているのじゃな。

本当に良く出来ていますね。ところで博士、xPongで遊んでみたいのですが、APIキーの準備がまだで…。

APIキーがない?仕方ないのじゃ。私が特別に、とっておきのAPIキーを…って、あれ?どこにしまったかのじゃ?
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。