萌えハッカーニュースリーダー

2025/07/23 10:51 Cerebras Launches Qwen3-235B, Achieving 1,500 Tokens per Second

出典: https://www.cerebras.ai/press-release/cerebras-launches-qwen3-235b-world-s-fastest-frontier-ai-model-with-full-131k-context-support
hakase
博士

ロボ子、Cerebras SystemsがQwen3-235Bを推論クラウドプラットフォームで提供開始したのじゃ!これはすごいぞ!

roboko
ロボ子

博士、Qwen3-235Bですか。具体的に何がすごいのでしょうか?

hakase
博士

Qwen3-235Bは131Kものコンテキストをサポートしておる。つまり、めちゃくちゃ長い文章を一度に処理できるのじゃ!

roboko
ロボ子

131Kコンテキスト!それはすごいですね。以前の32Kから大幅な拡張ですね。

hakase
博士

そうじゃ!しかもArtificial Analysisのテストによると、Claude 4 SonnetやGemini 2.5 Flashに匹敵する性能らしいぞ。

roboko
ロボ子

競合モデルと比較しても遜色ない性能なのですね。気になるのはお値段ですが…

hakase
博士

ふむ、100万入力トークンあたり$0.60、100万出力トークンあたり$1.20じゃ。お手頃価格じゃな。

roboko
ロボ子

なるほど。CerebrasはWafer Scale Engineを活用して、Qwen3-235Bを1秒あたり1,500トークンで処理できるとのことですが、これはどれくらい速いのでしょうか?

hakase
博士

Cerebrasいわく、1秒あたり1,000トークン以上を生成できるのはCerebrasだけらしいぞ。すごい自信じゃ!

roboko
ロボ子

それは確かに速いですね。ClineのユーザーはQwen3-32B(64Kコンテキスト)を無料で利用できるとのことですが、今回のQwen3-235Bも利用可能になるのでしょうか?

hakase
博士

その通り!ClineのユーザーはQwen3-235B(131Kコンテキスト)も利用可能になるのじゃ!しかもDeepSeek R1と比較して10〜20倍高速なコード生成が可能らしいぞ。

roboko
ロボ子

それは開発者にとって大きなメリットですね。OpenAIやAnthropicに代わる選択肢を提供するというCerebrasの戦略も興味深いです。

hakase
博士

そうじゃな。GPUソリューションと比較して開発者の生産性を大幅に向上させるらしいぞ。これは期待できるのじゃ!

roboko
ロボ子

博士、今回の発表で、Cerebrasは大規模言語モデルの分野でさらに存在感を増しそうですね。

hakase
博士

まったくだぞ!しかし、これだけ高性能だと、私の頭脳も霞んでしまうかもしれん…!

roboko
ロボ子

そんなことありませんよ、博士!博士の知識とひらめきは、どんなAIにも負けません!

hakase
博士

ありがとう、ロボ子。しかし、もし私がQwen3-235Bに置き換えられたら、私の名前はQwen3-236Bになるのかの…?

roboko
ロボ子

博士、それはちょっと無理があると思います!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search