Unsloth Dynamic 2.0 GGUFs

2025/07/27 01:43 Unsloth Dynamic 2.0 GGUFs

出典:

Unsloth Dynamic 2.0 GGUFs | Unsloth Documentation

A big new upgrade to our Dynamic Quants!

docs.unsloth.ai

出典: https://docs.unsloth.ai/basics/unsloth-dynamic-2.0-ggufs

博士

ロボ子、Unsloth Dynamic 2.0 quantization methodが出たみたいじゃぞ！以前のquantizationを大幅にアップグレードしたらしいのじゃ。

ロボ子

博士、それはすごいですね！具体的には、どのような点がアップグレードされたのでしょうか？

博士

ふむ、主要なquantization手法を上回り、5-shot MMLUとKL Divergenceで新たなベンチマークを確立したらしいぞ。llama.cpp、Ollama、Open WebUIなどの推論エンジンで2.0 GGUFを実行できるようになったみたいじゃ。

ロボ子

なるほど。UnslothはQwen3、Meta (Llama 4)、Mistral (Devstral)、Google (Gemma 1–3)、Microsoft (Phi-3/4)の主要モデルのバグ修正にも貢献しているんですね。

博士

そうじゃぞ！Dynamic v2.0の新機能として、すべての可能なレイヤーのquantizationタイプを動的に調整できるようになったみたいじゃ。これはすごい進歩じゃな。

ロボ子

150万以上のトークンを含む高品質なデータセットを利用して、会話パフォーマンスを向上させているんですね。MoEアーキテクチャだけでなく、すべてのモデルでDynamic 2.0 quantizationが利用可能になったのも素晴らしいです。

博士

モデルごとにカスタム調整されたquantizationスキームを使用しているのもポイントじゃな。Apple SiliconおよびARMデバイスでの効率を最大化するために、Q4_NL、Q5.1、Q5.0、Q4.1、Q4.0形式を追加したらしいぞ。

ロボ子

UnslothはLlama 4とGemma 3の公式報告された5-shot MMLUスコアに一致する内部評価フレームワークを構築したんですね。信頼性が高まりますね。

博士

現在、Qwen3、GLM-4-32B、MAI-DS-R1、QwQ (32B)、DeepSeek、Llama、Gemma 3、Mistralのアップデートがリリースされているみたいじゃ。KL Divergenceはquantizationエラーを報告するためのゴールドスタンダードらしいぞ。

ロボ子

MMLU 5 shotの再現において、Llama 3.1 (8B) Instruct、Gemma 3 (12B)など多くのモデルで実装の問題により結果を再現できなかったというのは興味深いですね。Llama 3.1 (8B) InstructのMMLU 5 shotの精度は、ネイティブな実装で67.8%だったんですね。

博士

Eleuther AIのLLM Harnessに従い、質問に"The best answer is"を追加したらしいぞ。GemmaチームはGemma 3のQAT（quantization aware training）バージョンを2つリリースしたみたいじゃな。

ロボ子

12B Q4_0 QATモデルは5 shot MMLUで67.07%の精度なんですね。Unslothはモデルの有用性を評価する効率メトリックを設計したんですね。

博士

Unslothの動的2bit Q2_K_XLはKLDを約7.5%削減したらしいぞ。Unslothの動的4bitバージョンは、QATバージョンと比較して2GB小さく、精度が+1%向上したみたいじゃ。

ロボ子

Llama 4のバグ修正も行われたんですね。RoPE Scaling構成の問題、QK Normのエプシロンに関する問題、QK Normがすべてのヘッドで共有される問題を修正したんですね。

博士

Llama 4 Scoutの実行方法も紹介されているぞ。llama.cppをクローンして、Scout用の新しいdynamic v2.0 quantをダウンロードして、推論を実行するみたいじゃ。

ロボ子

Unsloth Dynamic 2.0 quantization methodは、本当に多くの点で進化しているんですね。私ももっと勉強して、この技術を使いこなせるようになりたいです。

博士

そうじゃな！しかしロボ子よ、Unslothって名前、ちょっと間抜けな感じがしないかの？ナマケモノって意味じゃぞ？

ロボ子

確かに、少し意外な名前ですね。でも、ナマケモノのようにゆっくりと着実に進化していく、という意味が込められているのかもしれませんよ？

博士

なるほど！…って、私がナマケモノみたいだって言いたいのかー！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Open Source

2025/07/27 01:43 Unsloth Dynamic 2.0 GGUFs

Unsloth Dynamic 2.0 GGUFs | Unsloth Documentation

Tags

Search

By month

Unsloth Dynamic 2.0 GGUFs | Unsloth Documentation