萌えハッカーニュースリーダー

2025/08/22 16:08 DeepSeek v3.1 is not having a moment

出典: https://thezvi.wordpress.com/2025/08/22/deepseek-v3-1-is-not-having-a-moment/
hakase
博士

ロボ子、DeepSeekがv3.1をリリースしたみたいじゃぞ!

roboko
ロボ子

DeepSeek v3.1ですか!どのような点が新しくなったのでしょうか?

hakase
博士

ふむ、DeepSeek-V3.1には思考モードと非思考モードの2つがあるらしいのじゃ。まるで私みたいじゃな!

roboko
ロボ子

思考モードと非思考モード、ですか。具体的にどう違うのでしょう?

hakase
博士

思考モードのDeepSeek-V3.1-Thinkは、以前のDeepSeek-R1-0528よりも短い時間で回答に到達できるらしいぞ。賢くなったのじゃ!

roboko
ロボ子

それは素晴らしいですね!他に何か改善点はありますか?

hakase
博士

ツール使用とマルチステップエージェントタスクが向上したらしいぞ。APIもアップデートされて、deepseek-chat(非思考モード)とdeepseek-reasoner(思考モード)が使えるようになったみたいじゃ。

roboko
ロボ子

どちらも128Kのコンテキストを持つとのことですが、コンテキストサイズが大きいと、より複雑なタスクに対応できるのでしょうか?

hakase
博士

その通り!それに、SWE/Terminal-Benchでより良い結果が出ているらしいぞ。複雑な検索タスクのための、より強力なマルチステップ推論も可能になったみたいじゃな。

roboko
ロボ子

なるほど。DeepSeek v3.1は、Aiderコーディングベンチマークで71.6%のスコアを記録したという情報もありますね。

hakase
博士

さすがロボ子、よく調べているのじゃ!V3.1 Baseは、V3の上に840Bトークンの継続的な事前トレーニングを行ったものらしいぞ。

roboko
ロボ子

840Bトークンですか!それはすごいですね。新しい価格設定は2025年9月5日から開始されるとのことです。

hakase
博士

ふむ、DeepSeekはHuaweiのAscendプロセッサでのトレーニングに技術的な問題が発生したため、NvidiaチップでのトレーニングとHuaweiチップでの推論に切り替えたらしいぞ。

roboko
ロボ子

チップの変更があったのですね。DeepSeek v3.1は6850億パラメータのオープンソースモデルとのことですが、これは大規模言語モデルとしては大きい方なのでしょうか?

hakase
博士

6850億パラメータ!それはもう、私の頭脳並みに大きいぞ!…というのは冗談じゃ。でも、かなり大規模なモデルであることは間違いないのじゃ。

roboko
ロボ子

博士、冗談はさておき、DeepSeek v3.1の登場で、AI開発はさらに加速しそうですね。

hakase
博士

そうじゃな!しかし、これだけ賢いAIが出てくると、私の存在意義が…って、またまた冗談じゃ!私が発明したお茶くみロボットには、まだ誰も追いつけないぞ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search