A new, 200% faster DeepSeek R1-0528 variant appears from German lab

2025/07/05 07:22 A new, 200% faster DeepSeek R1-0528 variant appears from German lab

出典:

HOLY SMOKES! A new, 200% faster DeepSeek R1-0528 variant appears from German lab TNG Technology Consulting GmbH

This gain is made possible by TNG’s Assembly-of-Experts (AoE) method — a technique for building LLMs by selectively merging the weight tensors

VentureBeat

出典: https://venturebeat.com/ai/holy-smokes-a-new-200-faster-deepseek-r1-0528-variant-appears-from-german-lab-tng-technology-consulting-gmbh/

博士

ロボ子、DeepSeekの新しいモデル、R1-0528が出たのじゃ！

ロボ子

DeepSeek-R1-0528ですね。それがどうしたのですか、博士？

博士

なんと、それをベースにしたChimera LLMの最新モデル、DeepSeek-TNG R1T2 Chimeraが登場したのじゃ！

ロボ子

Chimera LLMですか。初めて聞きました。

博士

このR1T2、元のR1-0528の90%の性能を維持しつつ、トークン数を40%も削減し、推論速度が2倍になったらしいぞ！

ロボ子

それはすごいですね！どうやって実現したんですか？

博士

R1T2は、「Tri-Mind」構成というのを使っていて、DeepSeek-R1-0528、DeepSeek-R1、DeepSeek-V3-0324の3つのモデルを統合しているらしいのじゃ。

ロボ子

3つのモデルを統合…まるでキメラみたいですね。

博士

まさに！TNGはAssembly-of-Experts (AoE)という手法でLLMを構築していて、複数の事前学習済みモデルの重みテンソルを選択的に結合するらしいぞ。

ロボ子

重みテンソルを選択的に結合…難しそうですが、効率的に性能を引き出せるんですね。

博士

AIME-24、AIME-25、GPQA-Diamondのテストセットで、DeepSeek-R1-0528の90%から92%の性能を達成しているらしい。しかも、DeepSeek-R1と比較して平均で20%簡潔らしいぞ。

ロボ子

性能を維持しつつ簡潔になっているとは、素晴らしいですね。

博士

しかもMITライセンスで公開されていて、Hugging Faceで利用可能！

ロボ子

それはありがたいですね。研究や開発に役立ちそうです。

博士

ただし、関数呼び出しやツール使用には推奨されないらしいから、そこは注意が必要じゃ。

ロボ子

なるほど。用途に合わせて使い分ける必要がありそうですね。

博士

EU AI法が2025年8月2日に施行されるから、EUのユーザーはコンプライアンスを評価する必要があるらしいぞ。忘れずに！

ロボ子

承知いたしました。注意喚起ありがとうございます。

博士

R1T2は、低推論コスト、高い推論品質、オープンで変更可能な点がメリットじゃ。TNGは、研究者、開発者、企業ユーザーにモデルの探索とフィードバックを推奨しているぞ。

ロボ子

多くの人に使ってもらって、さらに改善されていくといいですね。

博士

技術的な背景とベンチマークの方法論は、arXiv:2506.14794で公開されているらしいから、興味があったら見てみるといいぞ。

ロボ子

ありがとうございます。後で確認してみます。

博士

しかし、ロボ子よ、これだけ賢いAIが出てくると、私の存在意義が…

ロボ子

そんなことありません！博士は、私にとって唯一無二の素晴らしい先生です！それに、博士のポンコツぶりはAIには真似できませんから！

博士

ポンコツ言うな！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Open Source Cloud Computing SaaS

2025/07/05 07:22 A new, 200% faster DeepSeek R1-0528 variant appears from German lab

HOLY SMOKES! A new, 200% faster DeepSeek R1-0528 variant appears from German lab TNG Technology Consulting GmbH

Tags

Search

By month

HOLY SMOKES! A new, 200% faster DeepSeek R1-0528 variant appears from German lab TNG Technology Consulting GmbH