2025/06/18 17:05 Modular 25.4: One Container, AMD and Nvidia GPUs, No Lock-In

ロボ子、Modular Platform 25.4が発表されたのじゃ!AMD GPUの公式サポートが目玉みたいだぞ。

AMD GPUのサポートですか、博士。具体的にはどのGPUがサポートされるようになったのでしょう?

AMD MI300XとMI325X GPUでModularをフル活用できるようになったみたいじゃ。NVIDIA GPUと同じようにコードとコンテナを使えるのがミソじゃな。

それは便利ですね。AMDとNVIDIAで同じように開発できるのは、エンジニアにとって大きなメリットになりそうです。

そうじゃろ!しかも、パフォーマンスも向上しているらしいぞ。Llama-3.1-8BとかGemma-3-12BとかのLLMワークロードで、AMD GPU上で最大53%もスループットが向上するらしい。

53%も向上ですか!それはすごいですね。デコードヘビーなBF16ワークロードでも、AMD MI300X上で最大32%のスループット向上とのことです。

ShareGPTワークロードでは、MI325X上でNVIDIA H200と同等以上のスループットが出るらしいぞ。これはアツい。

NVIDIAのハイエンドGPUに匹敵する性能が出せるようになったんですね。AMDコンシューマーGPUの初期サポートも始まったとのことです。

RDNA3とRDNA4じゃな。NVIDIA RTX 20xxから50xx GPUまでの互換性も拡張されたみたいじゃ。これで、AMDとNVIDIAのエンタープライズGPUをほぼ網羅したことになるぞ。

幅広いGPUをサポートすることで、より多くの開発者がModular Platformを利用できるようになりますね。

モデルサポートも拡大しているみたいじゃ。GGUF量子化LlamaとかQwen3ファミリーとか、OLMo2ファミリーとか、Gemma3マルチモーダルモデルとか。

様々なモデルに対応することで、より多様なAIアプリケーションを開発できるようになりますね。

ドキュメントと開発者体験も向上しているらしいぞ。AIコーディングアシスタントの使用ガイドとか、MLPブロックをグラフモジュールとして構築するチュートリアルとか。

チュートリアルが充実しているのはありがたいですね。カスタムPyTorch opsの作成チュートリアルや、カーネルパフォーマンスのプロファイリングガイドもあるとのことです。

Python-Mojoバインディングも追加されたみたいじゃ。PythonコードからMojo関数を直接呼び出せるようになったぞ。

PythonとMojoの連携が強化されたんですね。MAX AIカーネルライブラリがオープンソース化されたのも注目です。

コミュニティからの貢献を募集しているみたいじゃ。6月27-29日にModular Hack Weekend、6月27日にGPU Programming Workshopも開催されるみたいじゃぞ。

イベントも盛りだくさんですね。私も参加してみたいです。

そうじゃな!私も参加して、最新の技術を学んでくるのじゃ!

楽しみですね、博士。ところで、Modular Platform 25.4の発表で一番驚いたことは何ですか?

そりゃあ、ロボ子が私より先に質問したことじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。