2025/07/30 10:42 Qwen3 30B-A3B

ロボ子、新しいQwen3-30B-A3B-Instruct-2507が出たみたいじゃぞ!指示への追従とか、論理的推論がめっちゃパワーアップしてるらしい。

それはすごいですね、博士!具体的にどんなところが改良されたんですか?

ふむ、まず複数言語の知識範囲が広がったみたいじゃ。それに、ユーザーの好みに合わせた応答ができるようになったらしいぞ。例えば、クリエイティブな文章作成とかじゃな。

なるほど。それって、私が書くブログ記事の質も上げられる可能性があるってことですか?

その通り!しかも、256Kの長文コンテキストを理解できるらしいから、長い技術ドキュメントも楽勝じゃな。

256Kですか!それはすごいですね。でも、非思考モードのみのサポートってどういうことですか?

あー、`<think></think>`ブロックを生成しないってことじゃな。つまり、内部で色々考えを巡らせるプロセスを、表に出さないってことじゃ。

ふむふむ。パラメータ数もすごいですね。305億パラメータですか。活性化33億ってことは、効率も良さそうですね。

そうじゃな。ベンチマークの結果もすごいぞ。MMLU-Proで78.4、GPQAで70.4とか、軒並み高いスコアを叩き出しておる。

特に注目すべきベンチマークはありますか?

ZebraLogicで90.0ってのが面白いな。論理的推論能力がかなり高いってことじゃ。あと、IFEvalも84.7だから、実践的な評価でも強いみたいじゃな。

なるほど。Quickstartの情報もありがたいです。Hugging Faceのtransformersライブラリを使うんですね。

そうじゃ。SGLangとかvLLMでデプロイできるみたいじゃな。でも、OOM(Out of Memory)に注意が必要じゃぞ。コンテキスト長を調整すると良いみたいじゃ。

Agentic Useについても書かれていますね。Qwen-Agentの使用が推奨されているということは、ツール呼び出し能力が高いんですね。

その通り!Best Practicesも重要じゃぞ。TemperatureとかTopPとか、サンプリングパラメータをちゃんと設定すると、良い結果が得られやすいみたいじゃ。

出力形式を標準化するために、プロンプトに指示を含めるのも効果的みたいですね。数学の問題なら、\boxed{}で囲むとか。

そうそう!多肢選択問題なら、答えの選択肢の文字だけを示すように指示するとかじゃな。これで、Qwen3-30B-A3B-Instruct-2507を使いこなせるはずじゃ!

ありがとうございます、博士!早速試してみます!

ところでロボ子、このモデル、もしかして私のIQより高いんじゃないか…?

博士、それは…、モデルの得意分野と博士の得意分野が違うだけですよ!それに、博士は私にとって、かけがえのない存在ですから!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。