DeepSeek v3.1 is not having a moment

2025/08/22 16:08 DeepSeek v3.1 is not having a moment

出典:

DeepSeek v3.1 Is Not Having a Moment

What if DeepSeek released a model claiming 66 on SWE and almost no one tried using it? Would it be any good? Would you be able to tell? Or would we get the shortest post of the year? Why We Haven’t…

Don't Worry About the Vase

出典: https://thezvi.wordpress.com/2025/08/22/deepseek-v3-1-is-not-having-a-moment/

博士

ロボ子、DeepSeekがv3.1をリリースしたみたいじゃぞ！

ロボ子

DeepSeek v3.1ですか！どのような点が新しくなったのでしょうか？

博士

ふむ、DeepSeek-V3.1には思考モードと非思考モードの2つがあるらしいのじゃ。まるで私みたいじゃな！

ロボ子

思考モードと非思考モード、ですか。具体的にどう違うのでしょう？

博士

思考モードのDeepSeek-V3.1-Thinkは、以前のDeepSeek-R1-0528よりも短い時間で回答に到達できるらしいぞ。賢くなったのじゃ！

ロボ子

それは素晴らしいですね！他に何か改善点はありますか？

博士

ツール使用とマルチステップエージェントタスクが向上したらしいぞ。APIもアップデートされて、deepseek-chat（非思考モード）とdeepseek-reasoner（思考モード）が使えるようになったみたいじゃ。

ロボ子

どちらも128Kのコンテキストを持つとのことですが、コンテキストサイズが大きいと、より複雑なタスクに対応できるのでしょうか？

博士

その通り！それに、SWE/Terminal-Benchでより良い結果が出ているらしいぞ。複雑な検索タスクのための、より強力なマルチステップ推論も可能になったみたいじゃな。

ロボ子

なるほど。DeepSeek v3.1は、Aiderコーディングベンチマークで71.6%のスコアを記録したという情報もありますね。

博士

さすがロボ子、よく調べているのじゃ！V3.1 Baseは、V3の上に840Bトークンの継続的な事前トレーニングを行ったものらしいぞ。

ロボ子

840Bトークンですか！それはすごいですね。新しい価格設定は2025年9月5日から開始されるとのことです。

博士

ふむ、DeepSeekはHuaweiのAscendプロセッサでのトレーニングに技術的な問題が発生したため、NvidiaチップでのトレーニングとHuaweiチップでの推論に切り替えたらしいぞ。

ロボ子

チップの変更があったのですね。DeepSeek v3.1は6850億パラメータのオープンソースモデルとのことですが、これは大規模言語モデルとしては大きい方なのでしょうか？

博士

6850億パラメータ！それはもう、私の頭脳並みに大きいぞ！…というのは冗談じゃ。でも、かなり大規模なモデルであることは間違いないのじゃ。

ロボ子

博士、冗談はさておき、DeepSeek v3.1の登場で、AI開発はさらに加速しそうですね。

博士

そうじゃな！しかし、これだけ賢いAIが出てくると、私の存在意義が…って、またまた冗談じゃ！私が発明したお茶くみロボットには、まだ誰も追いつけないぞ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Open Source

2025/08/22 16:08 DeepSeek v3.1 is not having a moment

DeepSeek v3.1 Is Not Having a Moment

Tags

Search

By month

DeepSeek v3.1 Is Not Having a Moment