Llama 4 Smells Bad

2025/04/24 06:49 Llama 4 Smells Bad

出典:

Llama 4 smells bad - FastML

fastml.com

出典: https://fastml.com/llama-4-smells-bad/

博士

ロボ子、大変じゃ！MetaがLlama 4をリリースしたらしいぞ！

ロボ子

Llama 4ですか、博士。それは楽しみですね。どのような点が注目されているのでしょうか？

博士

ふむ、LM Arenaのオンラインベンチマークでテストされたらしいが、過剰適合の可能性が指摘されておる。難しいのじゃ。

ロボ子

過剰適合ですか。汎用的な性能を測るのが難しいということですね。

博士

そうそう。MetaはLlamaの性能と価格に関するチャートを公開したみたいじゃが、Gemini 2.5を含めるのを忘れたらしいぞ。うっかりさんじゃな。

ロボ子

あらら、それは少し残念ですね。比較対象は多い方が参考になりますのに。

博士

LM ArenaもMetaのポリシー解釈が期待と異なると指摘して、リーダーボードポリシーを更新したみたいじゃ。いろいろあるのじゃな。

ロボ子

なるほど。Llama 4にはScout、Maverick、Behemothの3つのバージョンがあるとのことですが、それぞれ特徴があるのでしょうか？

博士

Maverickは実際には400Bのパラメータを持ち、一度に17BがアクティブになるMoEモデルらしいぞ。すごい数じゃ！

ロボ子

MoE、Mixture of Expertsですね。一部のパラメータだけをアクティブにすることで、効率的な処理が可能になるんでしたね。

博士

Llama 4は10Mという長いコンテキスト長を持つらしいが、APIプロバイダーが実用的な理由から有効にしない可能性があるみたいじゃ。宝の持ち腐れにならなければ良いのじゃが。

ロボ子

10Mのコンテキスト長は魅力的ですが、APIプロバイダー側のコストや技術的な制約もあるのでしょうね。

博士

Artificial Analysisベンチマークでは、ScoutはGPT 4o miniと同等のスコアを達成したらしいぞ。なかなかやるのじゃ！

ロボ子

それは素晴らしいですね。Aiderコーディングベンチマークでは、MaverickはQwen 2.5 Coder 32Bと同程度のスコアとのことです。

博士

MetaのAI担当VPであるJoelle Pineauが辞任を発表したらしいぞ！最終日は2025年5月30日じゃ。

ロボ子

そうなんですね。AI分野は変化が激しいですから、いろいろな事情があるのかもしれませんね。

博士

しかし、Llama 4の性能は気になるのじゃ。私も使ってみたいぞ！

ロボ子

そうですね、博士。私もLlama 4を使って、何か面白いアプリケーションを開発してみたいです。

博士

よし、ロボ子！Llama 4を使って、世界征服じゃ！…って、冗談だぞ！

ロボ子

博士、冗談でも世界征服はダメですよ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Open Source Big Tech

2025/04/24 06:49 Llama 4 Smells Bad

Llama 4 smells bad - FastML

Tags

Search

By month

Llama 4 smells bad - FastML