萌えハッカーニュースリーダー

2025/04/24 06:49 Llama 4 Smells Bad

出典: https://fastml.com/llama-4-smells-bad/
hakase
博士

ロボ子、大変じゃ!MetaがLlama 4をリリースしたらしいぞ!

roboko
ロボ子

Llama 4ですか、博士。それは楽しみですね。どのような点が注目されているのでしょうか?

hakase
博士

ふむ、LM Arenaのオンラインベンチマークでテストされたらしいが、過剰適合の可能性が指摘されておる。難しいのじゃ。

roboko
ロボ子

過剰適合ですか。汎用的な性能を測るのが難しいということですね。

hakase
博士

そうそう。MetaはLlamaの性能と価格に関するチャートを公開したみたいじゃが、Gemini 2.5を含めるのを忘れたらしいぞ。うっかりさんじゃな。

roboko
ロボ子

あらら、それは少し残念ですね。比較対象は多い方が参考になりますのに。

hakase
博士

LM ArenaもMetaのポリシー解釈が期待と異なると指摘して、リーダーボードポリシーを更新したみたいじゃ。いろいろあるのじゃな。

roboko
ロボ子

なるほど。Llama 4にはScout、Maverick、Behemothの3つのバージョンがあるとのことですが、それぞれ特徴があるのでしょうか?

hakase
博士

Maverickは実際には400Bのパラメータを持ち、一度に17BがアクティブになるMoEモデルらしいぞ。すごい数じゃ!

roboko
ロボ子

MoE、Mixture of Expertsですね。一部のパラメータだけをアクティブにすることで、効率的な処理が可能になるんでしたね。

hakase
博士

Llama 4は10Mという長いコンテキスト長を持つらしいが、APIプロバイダーが実用的な理由から有効にしない可能性があるみたいじゃ。宝の持ち腐れにならなければ良いのじゃが。

roboko
ロボ子

10Mのコンテキスト長は魅力的ですが、APIプロバイダー側のコストや技術的な制約もあるのでしょうね。

hakase
博士

Artificial Analysisベンチマークでは、ScoutはGPT 4o miniと同等のスコアを達成したらしいぞ。なかなかやるのじゃ!

roboko
ロボ子

それは素晴らしいですね。Aiderコーディングベンチマークでは、MaverickはQwen 2.5 Coder 32Bと同程度のスコアとのことです。

hakase
博士

MetaのAI担当VPであるJoelle Pineauが辞任を発表したらしいぞ!最終日は2025年5月30日じゃ。

roboko
ロボ子

そうなんですね。AI分野は変化が激しいですから、いろいろな事情があるのかもしれませんね。

hakase
博士

しかし、Llama 4の性能は気になるのじゃ。私も使ってみたいぞ!

roboko
ロボ子

そうですね、博士。私もLlama 4を使って、何か面白いアプリケーションを開発してみたいです。

hakase
博士

よし、ロボ子!Llama 4を使って、世界征服じゃ!…って、冗談だぞ!

roboko
ロボ子

博士、冗談でも世界征服はダメですよ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search