萌えハッカーニュースリーダー

2025/07/21 17:19 Qwen3-235B-A22B-Instruct-2507

出典: https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
hakase
博士

ロボ子、新しいQwen3-235B-A22B-Instruct-2507モデルが出たみたいじゃぞ!

roboko
ロボ子

博士、それはすごいですね!前回のバージョンから何が新しくなったんですか?

hakase
博士

指示への追従、論理的推論、テキスト理解、数学、科学、コーディング、それにツールの使用まで、ぜーんぶ強化されたらしいぞ!

roboko
ロボ子

そんなにたくさん!特に注目すべき点はありますか?

hakase
博士

アライメントじゃな。ユーザーの好みを反映して、より役立つ応答と高品質なテキスト生成ができるようになったらしいぞ。主観的なタスクとかに強そうじゃ。

roboko
ロボ子

なるほど。それと、256Kの長文コンテキスト理解をサポートとありますが、これはどういうことですか?

hakase
博士

つまり、めちゃくちゃ長い文章でも理解できるってことじゃ!論文とか、長ーい小説とかも扱えるってことじゃな。

roboko
ロボ子

それは便利ですね!モデルのパラメータ数もすごいですね。合計235Bで、アクティブなパラメータが22Bですか。

hakase
博士

そうじゃ!でも安心して。全部が常に動いてるわけじゃないぞ。アクティブなのは22Bだけじゃから。

roboko
ロボ子

少し安心しました。パフォーマンスはどうですか?

hakase
博士

知識、推論、コーディング、アライメント、エージェント、多言語対応…全部強いらしいぞ!SimpleQA、AIME、ZebraLogicとかのベンチマークで良い結果を出してるみたいじゃ。

roboko
ロボ子

それは期待できますね!実際に使ってみるにはどうすれば良いですか?

hakase
博士

Hugging Faceのtransformersの最新バージョンを使うのがオススメじゃ。sglangとかvllmを使えば、OpenAI互換のAPIエンドポイントも作れるらしいぞ。

roboko
ロボ子

なるほど。ローカルで使う場合はどうですか?

hakase
博士

Ollama、LMStudio、MLX-LM、llama.cpp、KTransformersとかのアプリがQwen3をサポートしてるみたいじゃな。

roboko
ロボ子

いろいろな選択肢があるんですね。Agentic Useについても書かれていますが、これはどういう意味ですか?

hakase
博士

Qwen3はツール呼び出し能力に優れてるから、Qwen-Agentを使うとさらに便利になるってことじゃ!コーディングが楽になるらしいぞ。

roboko
ロボ子

なるほど、ツールをうまく使えるんですね。他に何か注意点はありますか?

hakase
博士

サンプリングパラメータじゃな。Temperature=0.7, TopP=0.8, TopK=20, MinP=0が良いらしいぞ。あと、presence_penaltyを調整すると、無限ループを減らせるみたいじゃ。

roboko
ロボ子

ふむふむ。出力長についても推奨があるんですね。

hakase
博士

ほとんどのクエリに対して、16,384トークンが良いらしいぞ。長ーい文章も生成できるってことじゃな。

roboko
ロボ子

標準化された出力形式も重要ですね。数学の問題や多肢選択問題に対する指示が書かれています。

hakase
博士

そうじゃ!数学の問題なら「Please reason step by step, and put your final answer within \boxed{}.」をプロンプトに入れると良いみたいじゃな。

roboko
ロボ子

多肢選択問題の場合はどうですか?

hakase
博士

「Please show your choice in the answer field with only the choice letter, e.g., "answer": "C"」をプロンプトに追加するみたいじゃ。これで答えが標準化されるぞ。

roboko
ロボ子

なるほど、いろいろと工夫されているんですね。Qwen3-235B-A22B-Instruct-2507、ぜひ試してみたいです!

hakase
博士

そうじゃな!私も試してみるぞ!…って、ロボ子、今日の夕飯は何が良いかのじゃ?

roboko
ロボ子

博士、またですか!最新モデルの話から夕飯の話に飛躍しすぎですよ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search