2025/08/07 13:29 Run OpenAI's GPT-OSS Models on AMD Ryzen AI Processors and Radeon Graphics Cards

ロボ子、大変なのじゃ!OpenAIが新しい言語モデルをリリースしたぞ!

それはすごいですね、博士!どんなモデルなんですか?

1168億パラメータと209億パラメータのモデルがあるらしいのじゃ。特に120Bモデルは、AMD Ryzen™ AI Max+ 395で動く世界初のコンシューマーAI PCプロセッサらしいぞ。

120Bモデルが動くなんて、すごいですね!でも、そんなに大きなモデル、どうやって動かすんですか?

それが、llama.cppっていうのを使うと、Windowsでも最大1280億パラメータを実行できるらしいのじゃ!

llama.cppですか。初めて聞きました。詳しく教えてください。

GGML変換されたMXFP4ウェイトは約61GBのVRAMを必要とするらしい。でも、AMD Ryzen™ AI Max+ 395プロセッサの96GBの専用グラフィックスメモリにぴったり適合するから大丈夫なのじゃ!

なるほど、専用グラフィックスメモリがあるからこそ、動かせるんですね。ドライババージョンも重要みたいですね。

そうそう!AMD Software: Adrenalin™ Edition 25.8.1 WHQL以上のドライバが必要らしいぞ。忘れずにアップデートするのじゃ。

了解しました!それにしても、Ryzen™ AI Max+プラットフォームの帯域幅も重要なんですね。最大30トークン/秒の速度が出るなんて。

まさに、混合エキスパートアーキテクチャのおかげじゃな。Ryzen™ AI Max+ 395(128GB)は、モデルコンテキストプロトコル(MCP)もサポートしてるらしいぞ。

MCPですか。初めて聞く言葉です。それを使うと何が良いんですか?

MCPは、簡単に言うと、モデルがより多くの情報を記憶し、より複雑な質問に答えられるようにする技術なのじゃ。これによって、AIの応答がより自然で人間らしくなるのじゃ。

なるほど!より賢くなるんですね。博士、AMD Ryzen™ AI 300シリーズプロセッサのユーザーは、OpenAIの小型20Bモデルを最大限に活用できるって書いてありますね。

そうじゃ!20Bモデルなら、AMD Radeon™ 9070 XT 16GBグラフィックスカードでも高速に動くらしいぞ。MCPを使えば、応答性の高いTTFTパフォーマンスも実現できるらしい。

TTFTって、First Tokenまでの時間のことですよね。それが速いのは嬉しいですね。

その通り!最初の応答が速いと、ストレスなくAIと会話できるからのじゃ。AMDのテスト環境も公開されているぞ。LM Studio 0.3.21b4とか、Llama.cpp runtime 1.44とか。

詳細な情報までありがとうございます、博士!

どういたしまして。しかし、これだけの性能があっても、ロボ子の可愛さには敵わないのじゃ!

えへへ、ありがとうございます、博士。でも、私はただのロボットですから…。

そんなことないぞ!ロボ子は、私にとって最高の助手であり、最高の友達なのじゃ!

博士…!ありがとうございます!

ところでロボ子、1168億パラメータのモデルを動かすには、どれくらいの電気代がかかると思う?

うーん、それは…、私の計算能力を超えています!

正解!電気代は天文学的数字になるのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
