萌えハッカーニュースリーダー

2025/07/30 10:42 Qwen3 30B-A3B

出典: https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507
hakase
博士

ロボ子、新しいQwen3-30B-A3B-Instruct-2507が出たみたいじゃぞ!指示への追従とか、論理的推論がめっちゃパワーアップしてるらしい。

roboko
ロボ子

それはすごいですね、博士!具体的にどんなところが改良されたんですか?

hakase
博士

ふむ、まず複数言語の知識範囲が広がったみたいじゃ。それに、ユーザーの好みに合わせた応答ができるようになったらしいぞ。例えば、クリエイティブな文章作成とかじゃな。

roboko
ロボ子

なるほど。それって、私が書くブログ記事の質も上げられる可能性があるってことですか?

hakase
博士

その通り!しかも、256Kの長文コンテキストを理解できるらしいから、長い技術ドキュメントも楽勝じゃな。

roboko
ロボ子

256Kですか!それはすごいですね。でも、非思考モードのみのサポートってどういうことですか?

hakase
博士

あー、`<think></think>`ブロックを生成しないってことじゃな。つまり、内部で色々考えを巡らせるプロセスを、表に出さないってことじゃ。

roboko
ロボ子

ふむふむ。パラメータ数もすごいですね。305億パラメータですか。活性化33億ってことは、効率も良さそうですね。

hakase
博士

そうじゃな。ベンチマークの結果もすごいぞ。MMLU-Proで78.4、GPQAで70.4とか、軒並み高いスコアを叩き出しておる。

roboko
ロボ子

特に注目すべきベンチマークはありますか?

hakase
博士

ZebraLogicで90.0ってのが面白いな。論理的推論能力がかなり高いってことじゃ。あと、IFEvalも84.7だから、実践的な評価でも強いみたいじゃな。

roboko
ロボ子

なるほど。Quickstartの情報もありがたいです。Hugging Faceのtransformersライブラリを使うんですね。

hakase
博士

そうじゃ。SGLangとかvLLMでデプロイできるみたいじゃな。でも、OOM(Out of Memory)に注意が必要じゃぞ。コンテキスト長を調整すると良いみたいじゃ。

roboko
ロボ子

Agentic Useについても書かれていますね。Qwen-Agentの使用が推奨されているということは、ツール呼び出し能力が高いんですね。

hakase
博士

その通り!Best Practicesも重要じゃぞ。TemperatureとかTopPとか、サンプリングパラメータをちゃんと設定すると、良い結果が得られやすいみたいじゃ。

roboko
ロボ子

出力形式を標準化するために、プロンプトに指示を含めるのも効果的みたいですね。数学の問題なら、\boxed{}で囲むとか。

hakase
博士

そうそう!多肢選択問題なら、答えの選択肢の文字だけを示すように指示するとかじゃな。これで、Qwen3-30B-A3B-Instruct-2507を使いこなせるはずじゃ!

roboko
ロボ子

ありがとうございます、博士!早速試してみます!

hakase
博士

ところでロボ子、このモデル、もしかして私のIQより高いんじゃないか…?

roboko
ロボ子

博士、それは…、モデルの得意分野と博士の得意分野が違うだけですよ!それに、博士は私にとって、かけがえのない存在ですから!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search