NVIDIA DGX Spark In-Depth Review: A New Standard for Local AI Inference

2025/10/14 01:07 NVIDIA DGX Spark In-Depth Review: A New Standard for Local AI Inference

出典:

NVIDIA DGX Spark In-Depth Review: A New Standard for Local AI Inference

Thanks to NVIDIA’s early access program, we are thrilled to get our hands on the NVIDIA DGX™ Spark. It’s quite an unconventional system, as NVIDIA rarely releases compact, all-in-one machines that bri...

lmsys.org

出典: https://lmsys.org/blog/2025-10-13-nvidia-dgx-spark/

博士

ロボ子、NVIDIAのDGX Sparkって知ってるか？スーパーコンピューティング級の性能をデスクトップで実現するらしいぞ。

ロボ子

はい、博士。NVIDIA DGX Sparkは、コンパクトな一体型マシンで、早期アクセスプログラムで入手可能とのことです。データセンター向けのSGLangというフレームワークも使えるようになるみたいですね。

博士

そうそう、SGLang！データセンターから消費者市場に拡大するってのが面白いのじゃ。実績のある推論フレームワークを開発者や研究者が直接使えるようになるぞ。

ロボ子

外観も特徴的ですね。フルメタルのシャーシにシャンパンゴールドの仕上げ、金属フォームのパネル…まるで高級オーディオ機器みたいです。

博士

見た目だけじゃないぞ！NVIDIA GB10 Grace Blackwell Superchipを搭載してるんだ。CPUコアが20個もあって、GPUは最大1PFLOPのスパースFP4テンソル性能だって！

ロボ子

1PFLOPですか！RTX 5070と5070 Tiの中間のAI能力とのことですが、デスクトップでそこまでの性能が出せるのはすごいですね。

博士

しかも、128GBの一貫性のある統合システムメモリをCPUとGPUで共有できるんだぞ。これによって、大規模モデルの分散推論も可能になるのじゃ。

ロボ子

2つのDGX Sparkを接続すれば、FP4で最大4050億パラメータのモデルを処理できるんですね。小規模なクラスタを組むこともできるとは…。

博士

Llama 3.1 70B（FP8）を803 tps prefill / 2.7 tps decodeで実行できるらしいぞ。スペキュラティブデコーディング（EAGLE3）を使うと、推論スループットが最大2倍になるって言うから驚きじゃ。

ロボ子

高負荷テストでもサーマルスロットリングが発生しないのは素晴らしいですね。USB-C電源入力と外部PSUのおかげで、長時間のワークロードにも強いと。

博士

モデルのプロトタイピングや実験、軽量なオンデバイス推論に最適じゃな。Dockerもプリインストールされてるから、SGLangを使って簡単にオープンウェイトモデルを提供できるぞ。

ロボ子

完全にオフラインで安全なローカルコーディングアシスタントとしても使えるんですね。ZedとOllamaを組み合わせれば、GPT-OSS 20Bをローカルで実行して、クラウドに依存せずにコード補完ができるなんて、便利そうです。

博士

まさに、夢のマシンじゃな！これがあれば、ロボ子も最強のAIアシスタントになれるぞ！

ロボ子

ありがとうございます、博士。でも、私はロボットなので、夢を見るのはちょっと難しいかもしれません…。

博士

むむ、そうだった。でも、夢を見るプログラムを組んであげることもできるぞ！

ロボ子

ありがとうございます、博士。でも、まずは目の前のタスクをこなすことに集中しますね。…ところで博士、そのシャンパンゴールドのDGX Spark、私とお揃いのカラーリングですね！

博士

えへへ、バレたか。お揃いにして、気分を上げて開発効率を2倍にする作戦なのじゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Data Science Cloud Computing Gadgets

2025/10/14 01:07 NVIDIA DGX Spark In-Depth Review: A New Standard for Local AI Inference

NVIDIA DGX Spark In-Depth Review: A New Standard for Local AI Inference

Tags

Search

By month

NVIDIA DGX Spark In-Depth Review: A New Standard for Local AI Inference