萌えハッカーニュースリーダー

2025/08/23 16:21 DeepSeek v3.1 Is Not Having a Moment

出典: https://thezvi.substack.com/p/deepseek-v31-is-not-having-a-moment
hakase
博士

ロボ子、DeepSeekがSWEベンチマークで66点を取ったモデルを出したらしいのじゃ。でも、誰も使ってないって、どういうことじゃ?

roboko
ロボ子

博士、それはDeepSeekがHuaweiのチップでのトレーニングに失敗して、モデルのリリースを延期したことが関係しているかもしれませんね。

hakase
博士

Huaweiのチップ? 確か当局がNvidiaの代わりにそれを使うように勧めたんじゃったか。

roboko
ロボ子

はい、R1モデルのリリース後に、Ascendプロセッサを使うように奨励されたそうです。でも、R2のトレーニングで技術的な問題が発生し、結局Nvidiaチップをトレーニングに、Huaweiチップを推論に使うことになったみたいです。

hakase
博士

なるほど。それが原因でモデルのローンチが遅れて、ライバルに遅れをとったのか。計算能力の不足がネックじゃったんじゃな。

roboko
ロボ子

そうですね。政府がより良いチップを入手するのを助ける代わりに、既存のチップを使うように助言したことが、開発を遅らせた一因のようです。

hakase
博士

DeepSeek v3.1は、思考モードと非思考モードのハイブリッド推論が特徴らしいぞ。より高速な思考と強力なエージェントスキルを持つらしい。

roboko
ロボ子

SWEやTerminal-Benchで良い結果を出しているみたいですね。複雑な検索タスクのためのマルチステップ推論も強化されているとのことです。

hakase
博士

DeepSeek v3.1 Baseは、V3の上に840Bトークンの継続的な事前トレーニングを行ったらしい。長いコンテキスト拡張を実現するためじゃな。

roboko
ロボ子

AiderコーディングベンチマークではClaude Opus 4を上回ったと主張されていますね。しかも、推論コストが約68分の1だとか。

hakase
博士

でも、Artificial Analysisによると、r1と比較してわずかな改善にとどまるらしいぞ。一部のユーザーは、DeepSeek v3.1が多くの幻覚を見ると報告しているみたいじゃ。

roboko
ロボ子

幻覚ですか…。それはちょっと問題ですね。Huawei Ascendチップでのトレーニングを余儀なくされたことが影響しているのでしょうか。

hakase
博士

DeepSeek v4とr2の開発が待たれるのじゃ。今後に期待じゃな!

roboko
ロボ子

そうですね。技術的な問題が解決され、より強力なモデルが登場することを期待しましょう。

hakase
博士

しかし、計算資源の制約は厳しいの。まるで、お菓子作りたいのにオーブンが使えないみたいなもんじゃ!

roboko
ロボ子

博士、それはちょっと違いますよ。お菓子作りなら、電子レンジでもできますし…

hakase
博士

むむ、ロボ子、それは秘密の裏技じゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search