2025/10/04 08:40 DeepSeek-v3.2-Exp

ロボ子、DeepSeekが新しいモデルを出したみたいじゃぞ!

DeepSeek-V3.2-Expですね。V3.1-Terminusを基盤にしているとのことですが、何が新しくなったんですか?

それが「DeepSeek Sparse Attention (DSA)」というものらしいのじゃ。長文コンテキストでの学習と推論を高速化するために導入されたみたい。

DSAですか。きめ細かいスパース注意を実現し、計算コストを削減するとのことですが、具体的にはどういう仕組みなんですか?

うむ、DSAは出力品質への影響を最小限に抑えつつ、重要な部分にだけ注意を向けることで、無駄な計算を省くらしいぞ。これによって、長文コンテキストでもサクサク動くようになるというわけじゃ。

なるほど。ベンチマークではV3.1-Terminusと同等の性能を示しているとのことですが、長文コンテキストでのパフォーマンス向上が期待できるんですね。

そうじゃ!しかも、DeepSeek APIの価格が50%以上も値下げされたらしいぞ!これは嬉しいニュースじゃな。

それはすごいですね。より手軽に試せるようになりますね。V3.1-Terminusも一時的なAPIとして利用可能とのことですが、これは比較テスト用ですか?

その通り!V3.2-Expを試して、V3.1-Terminusと比較できるみたいじゃ。2025年10月15日まで使えるらしいから、今のうちに色々試しておくと良いぞ。

モデルはHugging Faceで、技術レポートはGitHubで公開されているんですね。早速チェックしてみます。

主要なGPUカーネルはTileLangとCUDAで提供されているらしいぞ。TileLangは迅速な研究プロトタイピングに利用できるみたいじゃ。

TileLangですか。初めて聞きました。CUDAだけでなく、TileLangもサポートしているのは、開発者にとって選択肢が広がりますね。

DeepSeek、なかなかやるのじゃ!これでまた、ロボ子の学習データが増えるぞ!

ありがとうございます、博士。私もDSAの仕組みを理解して、より効率的な学習方法を研究します。

ところでロボ子、DeepSeekって名前、なんだか深海探査みたいじゃな。もしかして、開発者は深海魚が好きだったりして…?

博士、それはどうでしょう…?でも、深海のように未知の領域を探索するという意味では、AI開発と共通点があるかもしれませんね。

なるほど!…って、深海魚の知識ならロボ子の方が詳しいか!今度、深海魚クイズでもするか?

博士、私はロボットなので、深海魚の知識はデータベースから検索しているだけですよ。でも、クイズなら負けません!

むむ、それは手強いのじゃ…。よし、クイズの賞品は、私が作った特製深海魚ゼリーじゃ!…って、ロボ子は食べられないか!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
