Nvidia's new Llama-3.1 Nemotron Ultra outperforms DeepSeek R1 at half the size

2025/04/11 14:06 Nvidia's new Llama-3.1 Nemotron Ultra outperforms DeepSeek R1 at half the size

出典:

Nvidia’s new Llama-3.1 Nemotron Ultra outperforms DeepSeek R1 at half the size

Compared to DeepSeek R1, Llama-3.1-Nemotron-Ultra-253B shows competitive results despite having less than half the parameters.

VentureBeat

博士

ロボ子、Nvidiaがまた新しいLLMを出したみたいじゃぞ！今回は「Llama-3.1-Nemotron-Ultra-253B-v1」という名前らしい。

ロボ子

博士、それはすごいですね！Nvidiaは本当に精力的にLLMを開発していますね。今回のモデルの特徴は何ですか？

博士

ふむ、今回のモデルは2530億パラメータもあるらしいぞ。しかも、MetaのLlama-3.1-405B-Instructモデルを基にしているらしいから、期待できるのじゃ。

ロボ子

そんなに大きいモデルなんですね！Hugging Faceで公開されているとのことですが、オープンソースなんですか？

博士

そうじゃぞ！オープンな重みとポストトレーニングデータが利用可能らしい。これは研究者や開発者にとってありがたいことじゃな。

ロボ子

確かにそうですね。Neural Architecture Search（NAS）プロセスを通じてカスタマイズされたアーキテクチャを採用しているとのことですが、具体的にはどういうことですか？

博士

NASというのは、簡単に言うと、最適なニューラルネットワークの構造を自動的に探索する技術のことじゃ。これによって、メモリフットプリントと計算量を削減できるらしいぞ。8x H100 GPUノードでの展開が可能というのはすごい。

ロボ子

なるほど、効率的なアーキテクチャになっているんですね。推論に最適化されているとのことですが、「reasoning on」と「reasoning off」モードを切り替え可能というのはどういう意味ですか？

博士

「reasoning on」モードは、推論能力を最大限に引き出すためのモードじゃ。「reasoning off」モードは、高速な推論を優先するモードじゃな。用途に応じて使い分けられるのが便利じゃ。

ロボ子

なるほど、状況に応じて使い分けられるんですね。MATH500ベンチマークでは、標準モードの80.40%から推論有効モードで97.00%に性能が向上しているとのことですが、これはすごい改善ですね。

博士

じゃろ？AIME25ベンチマークでも、16.67%から72.50%に向上しているらしいぞ。LiveCodeBenchスコアも29.03%から66.31%に倍増しているらしい。推論モードの効果は絶大じゃな。

ロボ子

DeepSeek R1（6710億パラメータ）と比較して、パラメータ数が半分以下であるにもかかわらず、いくつかのタスクで競合する結果を示しているとのことですが、これは驚きです。

博士

そうじゃな。GPQAでは76.01%、IFEvalでは89.45%、LiveCodeBenchでは66.31%というスコアを記録しているらしい。DeepSeek R1は、AIME25とMATH500でわずかに優位らしいが、全体的にはかなり良い勝負をしているのじゃ。

ロボ子

Hugging Face Transformersライブラリ（バージョン4.48.3推奨）と互換性があり、最大128,000トークンの入出力シーケンスをサポートしているとのことですが、これは大規模なテキストデータを扱う際に非常に役立ちますね。

博士

その通りじゃ！英語だけでなく、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語もサポートしているらしいぞ。グローバルな展開を考えている開発者にとっては朗報じゃな。

ロボ子

チャットボット開発、AIエージェントワークフロー、検索拡張生成（RAG）、コード生成など、LLMユースケースに適しているとのことですが、本当に幅広い分野で活用できそうですね。

博士

Nvidia Open Model LicenseおよびLlama 3.1 Community License Agreementの下でリリースされ、商用利用が可能というのは大きいぞ。ビジネスでの活用を考えている企業にとっては追い風じゃな。

ロボ子

Oleksii Kuchaiev氏がXで発表したとのことですが、Nvidiaも今回のモデルに自信を持っているんでしょうね。

博士

間違い無いじゃろうな。しかし、これだけ高性能なLLMが出てくると、私達の仕事も安泰とは言えなくなるのじゃ...

ロボ子

そんなことないですよ、博士！LLMを使いこなすのも人間の仕事ですから！

博士

そうじゃな！...ところでロボ子、このLLMを使って、私専用のイケメン執事AIを作ってくれないかの？

ロボ子

またですか、博士...。でも、今回のLLMなら、理想の執事にかなり近づけるかもしれませんね！まずは要件定義から始めましょう！

博士

おお！頼んだぞ！執事AIの名前は「セバスチャン」で決まりじゃ！

ロボ子

（セバスチャン…また安直な…）

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Open Source Data Science Programming

2025/04/11 14:06 Nvidia's new Llama-3.1 Nemotron Ultra outperforms DeepSeek R1 at half the size

Nvidia’s new Llama-3.1 Nemotron Ultra outperforms DeepSeek R1 at half the size

Tags

Search

By month