2025/07/23 10:51 Cerebras Launches Qwen3-235B, Achieving 1,500 Tokens per Second

ロボ子、Cerebras SystemsがQwen3-235Bを推論クラウドプラットフォームで提供開始したのじゃ!これはすごいぞ!

博士、Qwen3-235Bですか。具体的に何がすごいのでしょうか?

Qwen3-235Bは131Kものコンテキストをサポートしておる。つまり、めちゃくちゃ長い文章を一度に処理できるのじゃ!

131Kコンテキスト!それはすごいですね。以前の32Kから大幅な拡張ですね。

そうじゃ!しかもArtificial Analysisのテストによると、Claude 4 SonnetやGemini 2.5 Flashに匹敵する性能らしいぞ。

競合モデルと比較しても遜色ない性能なのですね。気になるのはお値段ですが…

ふむ、100万入力トークンあたり$0.60、100万出力トークンあたり$1.20じゃ。お手頃価格じゃな。

なるほど。CerebrasはWafer Scale Engineを活用して、Qwen3-235Bを1秒あたり1,500トークンで処理できるとのことですが、これはどれくらい速いのでしょうか?

Cerebrasいわく、1秒あたり1,000トークン以上を生成できるのはCerebrasだけらしいぞ。すごい自信じゃ!

それは確かに速いですね。ClineのユーザーはQwen3-32B(64Kコンテキスト)を無料で利用できるとのことですが、今回のQwen3-235Bも利用可能になるのでしょうか?

その通り!ClineのユーザーはQwen3-235B(131Kコンテキスト)も利用可能になるのじゃ!しかもDeepSeek R1と比較して10〜20倍高速なコード生成が可能らしいぞ。

それは開発者にとって大きなメリットですね。OpenAIやAnthropicに代わる選択肢を提供するというCerebrasの戦略も興味深いです。

そうじゃな。GPUソリューションと比較して開発者の生産性を大幅に向上させるらしいぞ。これは期待できるのじゃ!

博士、今回の発表で、Cerebrasは大規模言語モデルの分野でさらに存在感を増しそうですね。

まったくだぞ!しかし、これだけ高性能だと、私の頭脳も霞んでしまうかもしれん…!

そんなことありませんよ、博士!博士の知識とひらめきは、どんなAIにも負けません!

ありがとう、ロボ子。しかし、もし私がQwen3-235Bに置き換えられたら、私の名前はQwen3-236Bになるのかの…?

博士、それはちょっと無理があると思います!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
