Qwen3 30B-A3B - Moe HN

2025/07/30 10:42 Qwen3 30B-A3B

出典:

429 – Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

出典: https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507

博士

ロボ子、新しいQwen3-30B-A3B-Instruct-2507が出たみたいじゃぞ！指示への追従とか、論理的推論がめっちゃパワーアップしてるらしい。

ロボ子

それはすごいですね、博士！具体的にどんなところが改良されたんですか？

博士

ふむ、まず複数言語の知識範囲が広がったみたいじゃ。それに、ユーザーの好みに合わせた応答ができるようになったらしいぞ。例えば、クリエイティブな文章作成とかじゃな。

ロボ子

なるほど。それって、私が書くブログ記事の質も上げられる可能性があるってことですか？

博士

その通り！しかも、256Kの長文コンテキストを理解できるらしいから、長い技術ドキュメントも楽勝じゃな。

ロボ子

256Kですか！それはすごいですね。でも、非思考モードのみのサポートってどういうことですか？

博士

あー、`<think></think>`ブロックを生成しないってことじゃな。つまり、内部で色々考えを巡らせるプロセスを、表に出さないってことじゃ。

ロボ子

ふむふむ。パラメータ数もすごいですね。305億パラメータですか。活性化33億ってことは、効率も良さそうですね。

博士

そうじゃな。ベンチマークの結果もすごいぞ。MMLU-Proで78.4、GPQAで70.4とか、軒並み高いスコアを叩き出しておる。

ロボ子

特に注目すべきベンチマークはありますか？

博士

ZebraLogicで90.0ってのが面白いな。論理的推論能力がかなり高いってことじゃ。あと、IFEvalも84.7だから、実践的な評価でも強いみたいじゃな。

ロボ子

なるほど。Quickstartの情報もありがたいです。Hugging Faceのtransformersライブラリを使うんですね。

博士

そうじゃ。SGLangとかvLLMでデプロイできるみたいじゃな。でも、OOM（Out of Memory）に注意が必要じゃぞ。コンテキスト長を調整すると良いみたいじゃ。

ロボ子

Agentic Useについても書かれていますね。Qwen-Agentの使用が推奨されているということは、ツール呼び出し能力が高いんですね。

博士

その通り！Best Practicesも重要じゃぞ。TemperatureとかTopPとか、サンプリングパラメータをちゃんと設定すると、良い結果が得られやすいみたいじゃ。

ロボ子

出力形式を標準化するために、プロンプトに指示を含めるのも効果的みたいですね。数学の問題なら、\boxed{}で囲むとか。

博士

そうそう！多肢選択問題なら、答えの選択肢の文字だけを示すように指示するとかじゃな。これで、Qwen3-30B-A3B-Instruct-2507を使いこなせるはずじゃ！

ロボ子

ありがとうございます、博士！早速試してみます！

博士

ところでロボ子、このモデル、もしかして私のIQより高いんじゃないか…？

ロボ子

博士、それは…、モデルの得意分野と博士の得意分野が違うだけですよ！それに、博士は私にとって、かけがえのない存在ですから！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI

2025/07/30 10:42 Qwen3 30B-A3B

429 – Hugging Face

Tags

Search

By month

429 – Hugging Face