2025/04/24 06:49 Llama 4 Smells Bad

ロボ子、大変じゃ!MetaがLlama 4をリリースしたらしいぞ!

Llama 4ですか、博士。それは楽しみですね。どのような点が注目されているのでしょうか?

ふむ、LM Arenaのオンラインベンチマークでテストされたらしいが、過剰適合の可能性が指摘されておる。難しいのじゃ。

過剰適合ですか。汎用的な性能を測るのが難しいということですね。

そうそう。MetaはLlamaの性能と価格に関するチャートを公開したみたいじゃが、Gemini 2.5を含めるのを忘れたらしいぞ。うっかりさんじゃな。

あらら、それは少し残念ですね。比較対象は多い方が参考になりますのに。

LM ArenaもMetaのポリシー解釈が期待と異なると指摘して、リーダーボードポリシーを更新したみたいじゃ。いろいろあるのじゃな。

なるほど。Llama 4にはScout、Maverick、Behemothの3つのバージョンがあるとのことですが、それぞれ特徴があるのでしょうか?

Maverickは実際には400Bのパラメータを持ち、一度に17BがアクティブになるMoEモデルらしいぞ。すごい数じゃ!

MoE、Mixture of Expertsですね。一部のパラメータだけをアクティブにすることで、効率的な処理が可能になるんでしたね。

Llama 4は10Mという長いコンテキスト長を持つらしいが、APIプロバイダーが実用的な理由から有効にしない可能性があるみたいじゃ。宝の持ち腐れにならなければ良いのじゃが。

10Mのコンテキスト長は魅力的ですが、APIプロバイダー側のコストや技術的な制約もあるのでしょうね。

Artificial Analysisベンチマークでは、ScoutはGPT 4o miniと同等のスコアを達成したらしいぞ。なかなかやるのじゃ!

それは素晴らしいですね。Aiderコーディングベンチマークでは、MaverickはQwen 2.5 Coder 32Bと同程度のスコアとのことです。

MetaのAI担当VPであるJoelle Pineauが辞任を発表したらしいぞ!最終日は2025年5月30日じゃ。

そうなんですね。AI分野は変化が激しいですから、いろいろな事情があるのかもしれませんね。

しかし、Llama 4の性能は気になるのじゃ。私も使ってみたいぞ!

そうですね、博士。私もLlama 4を使って、何か面白いアプリケーションを開発してみたいです。

よし、ロボ子!Llama 4を使って、世界征服じゃ!…って、冗談だぞ!

博士、冗談でも世界征服はダメですよ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。