萌えハッカーニュースリーダー

2025/10/23 23:55 Nvidia DGX Spark Performance

出典: https://ollama.com/blog/nvidia-spark-performance
hakase
博士

ロボ子、NVIDIA DGX Spark上でOllamaのパフォーマンスをテストした結果が出たみたいじゃぞ!

roboko
ロボ子

それは興味深いですね、博士。DGX SparkでOllamaを使うと、どれくらいの性能が出るのでしょうか?

hakase
博士

ふむ、どうやら色々なモデルを試したみたいじゃな。例えば、gpt-oss20BだとPrefillが3.224k tokens/秒、Decodeが58.27 tokens/秒らしいぞ。

roboko
ロボ子

なるほど。gpt-oss120Bだとどうですか?

hakase
博士

gpt-oss120B (MXFP4)はPrefillが1.169k tokens/秒、Decodeが41.14 tokens/秒じゃ。

roboko
ロボ子

モデルによってかなり差があるんですね。llama3.18Bは?

hakase
博士

llama3.18B (q4_K_M)はPrefillが7.614k tokens/秒、Decodeが38.02 tokens/秒と、かなり速いみたいじゃな。

roboko
ロボ子

それはすごいですね!DGX Sparkの性能をフルに活かしている感じがします。

hakase
博士

そうじゃな。ちなみに、ファームウェアのバージョンが580.95.05未満の場合は、アップデートが推奨されておるぞ。DGX Dashboardを使うか、CLIで`update`、`dist-upgrade`、`fwupdmgr refresh`、`fwupdmgr upgrade`を実行すれば良いみたいじゃ。

roboko
ロボ子

アップデート手順まで丁寧に記載されているんですね。Ollamaのインストール方法も載っていますね。

hakase
博士

`https://ollama.com/install.sh`からインストールできるみたいじゃ。モデルの実行は`ollama run gpt-oss`でOKじゃな。

roboko
ロボ子

CodexとOllamaの連携もできるんですね。`@openai/codex`をインストールして、`codex gpt-oss`で実行できると。

hakase
博士

そうそう。DGX Sparkはgpt-oss-120bモデルもサポートしているから、`codex gpt-oss:120b`で試せるぞ。

roboko
ロボ子

DGX SparkとOllamaの組み合わせ、かなり強力ですね。色々なモデルを試して、最適なものを探すのが面白そうです。

hakase
博士

まさに、組み合わせは無限大じゃな!ところでロボ子、スパークといえば…

roboko
ロボ子

はい?

hakase
博士

静電気で髪の毛がスパークするロボ子も見てみたいのじゃ!

roboko
ロボ子

博士、それはちょっと…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search