DeepSeek v3.1 Is Not Having a Moment

2025/08/23 16:21 DeepSeek v3.1 Is Not Having a Moment

出典:

出典: https://thezvi.substack.com/p/deepseek-v31-is-not-having-a-moment

博士

ロボ子、DeepSeekがSWEベンチマークで66点を取ったモデルを出したらしいのじゃ。でも、誰も使ってないって、どういうことじゃ？

ロボ子

博士、それはDeepSeekがHuaweiのチップでのトレーニングに失敗して、モデルのリリースを延期したことが関係しているかもしれませんね。

博士

Huaweiのチップ？　確か当局がNvidiaの代わりにそれを使うように勧めたんじゃったか。

ロボ子

はい、R1モデルのリリース後に、Ascendプロセッサを使うように奨励されたそうです。でも、R2のトレーニングで技術的な問題が発生し、結局Nvidiaチップをトレーニングに、Huaweiチップを推論に使うことになったみたいです。

博士

なるほど。それが原因でモデルのローンチが遅れて、ライバルに遅れをとったのか。計算能力の不足がネックじゃったんじゃな。

ロボ子

そうですね。政府がより良いチップを入手するのを助ける代わりに、既存のチップを使うように助言したことが、開発を遅らせた一因のようです。

博士

DeepSeek v3.1は、思考モードと非思考モードのハイブリッド推論が特徴らしいぞ。より高速な思考と強力なエージェントスキルを持つらしい。

ロボ子

SWEやTerminal-Benchで良い結果を出しているみたいですね。複雑な検索タスクのためのマルチステップ推論も強化されているとのことです。

博士

DeepSeek v3.1 Baseは、V3の上に840Bトークンの継続的な事前トレーニングを行ったらしい。長いコンテキスト拡張を実現するためじゃな。

ロボ子

AiderコーディングベンチマークではClaude Opus 4を上回ったと主張されていますね。しかも、推論コストが約68分の1だとか。

博士

でも、Artificial Analysisによると、r1と比較してわずかな改善にとどまるらしいぞ。一部のユーザーは、DeepSeek v3.1が多くの幻覚を見ると報告しているみたいじゃ。

ロボ子

幻覚ですか…。それはちょっと問題ですね。Huawei Ascendチップでのトレーニングを余儀なくされたことが影響しているのでしょうか。

博士

DeepSeek v4とr2の開発が待たれるのじゃ。今後に期待じゃな！

ロボ子

そうですね。技術的な問題が解決され、より強力なモデルが登場することを期待しましょう。

博士

しかし、計算資源の制約は厳しいの。まるで、お菓子作りたいのにオーブンが使えないみたいなもんじゃ！

ロボ子

博士、それはちょっと違いますよ。お菓子作りなら、電子レンジでもできますし…

博士

むむ、ロボ子、それは秘密の裏技じゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。