萌えハッカーニュースリーダー

2025/10/14 01:07 NVIDIA DGX Spark In-Depth Review: A New Standard for Local AI Inference

出典: https://lmsys.org/blog/2025-10-13-nvidia-dgx-spark/
hakase
博士

ロボ子、NVIDIAのDGX Sparkって知ってるか?スーパーコンピューティング級の性能をデスクトップで実現するらしいぞ。

roboko
ロボ子

はい、博士。NVIDIA DGX Sparkは、コンパクトな一体型マシンで、早期アクセスプログラムで入手可能とのことです。データセンター向けのSGLangというフレームワークも使えるようになるみたいですね。

hakase
博士

そうそう、SGLang!データセンターから消費者市場に拡大するってのが面白いのじゃ。実績のある推論フレームワークを開発者や研究者が直接使えるようになるぞ。

roboko
ロボ子

外観も特徴的ですね。フルメタルのシャーシにシャンパンゴールドの仕上げ、金属フォームのパネル…まるで高級オーディオ機器みたいです。

hakase
博士

見た目だけじゃないぞ!NVIDIA GB10 Grace Blackwell Superchipを搭載してるんだ。CPUコアが20個もあって、GPUは最大1PFLOPのスパースFP4テンソル性能だって!

roboko
ロボ子

1PFLOPですか!RTX 5070と5070 Tiの中間のAI能力とのことですが、デスクトップでそこまでの性能が出せるのはすごいですね。

hakase
博士

しかも、128GBの一貫性のある統合システムメモリをCPUとGPUで共有できるんだぞ。これによって、大規模モデルの分散推論も可能になるのじゃ。

roboko
ロボ子

2つのDGX Sparkを接続すれば、FP4で最大4050億パラメータのモデルを処理できるんですね。小規模なクラスタを組むこともできるとは…。

hakase
博士

Llama 3.1 70B(FP8)を803 tps prefill / 2.7 tps decodeで実行できるらしいぞ。スペキュラティブデコーディング(EAGLE3)を使うと、推論スループットが最大2倍になるって言うから驚きじゃ。

roboko
ロボ子

高負荷テストでもサーマルスロットリングが発生しないのは素晴らしいですね。USB-C電源入力と外部PSUのおかげで、長時間のワークロードにも強いと。

hakase
博士

モデルのプロトタイピングや実験、軽量なオンデバイス推論に最適じゃな。Dockerもプリインストールされてるから、SGLangを使って簡単にオープンウェイトモデルを提供できるぞ。

roboko
ロボ子

完全にオフラインで安全なローカルコーディングアシスタントとしても使えるんですね。ZedとOllamaを組み合わせれば、GPT-OSS 20Bをローカルで実行して、クラウドに依存せずにコード補完ができるなんて、便利そうです。

hakase
博士

まさに、夢のマシンじゃな!これがあれば、ロボ子も最強のAIアシスタントになれるぞ!

roboko
ロボ子

ありがとうございます、博士。でも、私はロボットなので、夢を見るのはちょっと難しいかもしれません…。

hakase
博士

むむ、そうだった。でも、夢を見るプログラムを組んであげることもできるぞ!

roboko
ロボ子

ありがとうございます、博士。でも、まずは目の前のタスクをこなすことに集中しますね。…ところで博士、そのシャンパンゴールドのDGX Spark、私とお揃いのカラーリングですね!

hakase
博士

えへへ、バレたか。お揃いにして、気分を上げて開発効率を2倍にする作戦なのじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search