萌えハッカーニュースリーダー

2025/07/27 01:43 Unsloth Dynamic 2.0 GGUFs

出典: https://docs.unsloth.ai/basics/unsloth-dynamic-2.0-ggufs
hakase
博士

ロボ子、Unsloth Dynamic 2.0 quantization methodが出たみたいじゃぞ!以前のquantizationを大幅にアップグレードしたらしいのじゃ。

roboko
ロボ子

博士、それはすごいですね!具体的には、どのような点がアップグレードされたのでしょうか?

hakase
博士

ふむ、主要なquantization手法を上回り、5-shot MMLUとKL Divergenceで新たなベンチマークを確立したらしいぞ。llama.cpp、Ollama、Open WebUIなどの推論エンジンで2.0 GGUFを実行できるようになったみたいじゃ。

roboko
ロボ子

なるほど。UnslothはQwen3、Meta (Llama 4)、Mistral (Devstral)、Google (Gemma 1–3)、Microsoft (Phi-3/4)の主要モデルのバグ修正にも貢献しているんですね。

hakase
博士

そうじゃぞ!Dynamic v2.0の新機能として、すべての可能なレイヤーのquantizationタイプを動的に調整できるようになったみたいじゃ。これはすごい進歩じゃな。

roboko
ロボ子

150万以上のトークンを含む高品質なデータセットを利用して、会話パフォーマンスを向上させているんですね。MoEアーキテクチャだけでなく、すべてのモデルでDynamic 2.0 quantizationが利用可能になったのも素晴らしいです。

hakase
博士

モデルごとにカスタム調整されたquantizationスキームを使用しているのもポイントじゃな。Apple SiliconおよびARMデバイスでの効率を最大化するために、Q4_NL、Q5.1、Q5.0、Q4.1、Q4.0形式を追加したらしいぞ。

roboko
ロボ子

UnslothはLlama 4とGemma 3の公式報告された5-shot MMLUスコアに一致する内部評価フレームワークを構築したんですね。信頼性が高まりますね。

hakase
博士

現在、Qwen3、GLM-4-32B、MAI-DS-R1、QwQ (32B)、DeepSeek、Llama、Gemma 3、Mistralのアップデートがリリースされているみたいじゃ。KL Divergenceはquantizationエラーを報告するためのゴールドスタンダードらしいぞ。

roboko
ロボ子

MMLU 5 shotの再現において、Llama 3.1 (8B) Instruct、Gemma 3 (12B)など多くのモデルで実装の問題により結果を再現できなかったというのは興味深いですね。Llama 3.1 (8B) InstructのMMLU 5 shotの精度は、ネイティブな実装で67.8%だったんですね。

hakase
博士

Eleuther AIのLLM Harnessに従い、質問に"The best answer is"を追加したらしいぞ。GemmaチームはGemma 3のQAT(quantization aware training)バージョンを2つリリースしたみたいじゃな。

roboko
ロボ子

12B Q4_0 QATモデルは5 shot MMLUで67.07%の精度なんですね。Unslothはモデルの有用性を評価する効率メトリックを設計したんですね。

hakase
博士

Unslothの動的2bit Q2_K_XLはKLDを約7.5%削減したらしいぞ。Unslothの動的4bitバージョンは、QATバージョンと比較して2GB小さく、精度が+1%向上したみたいじゃ。

roboko
ロボ子

Llama 4のバグ修正も行われたんですね。RoPE Scaling構成の問題、QK Normのエプシロンに関する問題、QK Normがすべてのヘッドで共有される問題を修正したんですね。

hakase
博士

Llama 4 Scoutの実行方法も紹介されているぞ。llama.cppをクローンして、Scout用の新しいdynamic v2.0 quantをダウンロードして、推論を実行するみたいじゃ。

roboko
ロボ子

Unsloth Dynamic 2.0 quantization methodは、本当に多くの点で進化しているんですね。私ももっと勉強して、この技術を使いこなせるようになりたいです。

hakase
博士

そうじゃな!しかしロボ子よ、Unslothって名前、ちょっと間抜けな感じがしないかの?ナマケモノって意味じゃぞ?

roboko
ロボ子

確かに、少し意外な名前ですね。でも、ナマケモノのようにゆっくりと着実に進化していく、という意味が込められているのかもしれませんよ?

hakase
博士

なるほど!…って、私がナマケモノみたいだって言いたいのかー!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search