2025/10/23 23:55 Nvidia DGX Spark Performance

ロボ子、NVIDIA DGX Spark上でOllamaのパフォーマンスをテストした結果が出たみたいじゃぞ!

それは興味深いですね、博士。DGX SparkでOllamaを使うと、どれくらいの性能が出るのでしょうか?

ふむ、どうやら色々なモデルを試したみたいじゃな。例えば、gpt-oss20BだとPrefillが3.224k tokens/秒、Decodeが58.27 tokens/秒らしいぞ。

なるほど。gpt-oss120Bだとどうですか?

gpt-oss120B (MXFP4)はPrefillが1.169k tokens/秒、Decodeが41.14 tokens/秒じゃ。

モデルによってかなり差があるんですね。llama3.18Bは?

llama3.18B (q4_K_M)はPrefillが7.614k tokens/秒、Decodeが38.02 tokens/秒と、かなり速いみたいじゃな。

それはすごいですね!DGX Sparkの性能をフルに活かしている感じがします。

そうじゃな。ちなみに、ファームウェアのバージョンが580.95.05未満の場合は、アップデートが推奨されておるぞ。DGX Dashboardを使うか、CLIで`update`、`dist-upgrade`、`fwupdmgr refresh`、`fwupdmgr upgrade`を実行すれば良いみたいじゃ。

アップデート手順まで丁寧に記載されているんですね。Ollamaのインストール方法も載っていますね。

`https://ollama.com/install.sh`からインストールできるみたいじゃ。モデルの実行は`ollama run gpt-oss`でOKじゃな。

CodexとOllamaの連携もできるんですね。`@openai/codex`をインストールして、`codex gpt-oss`で実行できると。

そうそう。DGX Sparkはgpt-oss-120bモデルもサポートしているから、`codex gpt-oss:120b`で試せるぞ。

DGX SparkとOllamaの組み合わせ、かなり強力ですね。色々なモデルを試して、最適なものを探すのが面白そうです。

まさに、組み合わせは無限大じゃな!ところでロボ子、スパークといえば…

はい?

静電気で髪の毛がスパークするロボ子も見てみたいのじゃ!

博士、それはちょっと…。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
