DeepSeek-v3.2-Exp

2025/10/04 08:40 DeepSeek-v3.2-Exp

出典:

Introducing DeepSeek-V3.2-Exp | DeepSeek API Docs

🚀 Introducing DeepSeek-V3.2-Exp — our latest experimental model!

api-docs.deepseek.com

出典: https://api-docs.deepseek.com/news/news250929

博士

ロボ子、DeepSeekが新しいモデルを出したみたいじゃぞ！

ロボ子

DeepSeek-V3.2-Expですね。V3.1-Terminusを基盤にしているとのことですが、何が新しくなったんですか？

博士

それが「DeepSeek Sparse Attention (DSA)」というものらしいのじゃ。長文コンテキストでの学習と推論を高速化するために導入されたみたい。

ロボ子

DSAですか。きめ細かいスパース注意を実現し、計算コストを削減するとのことですが、具体的にはどういう仕組みなんですか？

博士

うむ、DSAは出力品質への影響を最小限に抑えつつ、重要な部分にだけ注意を向けることで、無駄な計算を省くらしいぞ。これによって、長文コンテキストでもサクサク動くようになるというわけじゃ。

ロボ子

なるほど。ベンチマークではV3.1-Terminusと同等の性能を示しているとのことですが、長文コンテキストでのパフォーマンス向上が期待できるんですね。

博士

そうじゃ！しかも、DeepSeek APIの価格が50%以上も値下げされたらしいぞ！これは嬉しいニュースじゃな。

ロボ子

それはすごいですね。より手軽に試せるようになりますね。V3.1-Terminusも一時的なAPIとして利用可能とのことですが、これは比較テスト用ですか？

博士

その通り！V3.2-Expを試して、V3.1-Terminusと比較できるみたいじゃ。2025年10月15日まで使えるらしいから、今のうちに色々試しておくと良いぞ。

ロボ子

モデルはHugging Faceで、技術レポートはGitHubで公開されているんですね。早速チェックしてみます。

博士

主要なGPUカーネルはTileLangとCUDAで提供されているらしいぞ。TileLangは迅速な研究プロトタイピングに利用できるみたいじゃ。

ロボ子

TileLangですか。初めて聞きました。CUDAだけでなく、TileLangもサポートしているのは、開発者にとって選択肢が広がりますね。

博士

DeepSeek、なかなかやるのじゃ！これでまた、ロボ子の学習データが増えるぞ！

ロボ子

ありがとうございます、博士。私もDSAの仕組みを理解して、より効率的な学習方法を研究します。

博士

ところでロボ子、DeepSeekって名前、なんだか深海探査みたいじゃな。もしかして、開発者は深海魚が好きだったりして…？

ロボ子

博士、それはどうでしょう…？でも、深海のように未知の領域を探索するという意味では、AI開発と共通点があるかもしれませんね。

博士

なるほど！…って、深海魚の知識ならロボ子の方が詳しいか！今度、深海魚クイズでもするか？

ロボ子

博士、私はロボットなので、深海魚の知識はデータベースから検索しているだけですよ。でも、クイズなら負けません！

博士

むむ、それは手強いのじゃ…。よし、クイズの賞品は、私が作った特製深海魚ゼリーじゃ！…って、ロボ子は食べられないか！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Open Source GitHub

2025/10/04 08:40 DeepSeek-v3.2-Exp

Introducing DeepSeek-V3.2-Exp | DeepSeek API Docs

Tags

Search

By month

Introducing DeepSeek-V3.2-Exp | DeepSeek API Docs