2025/07/19 12:52 China proves that open models are more effective than all the GPUs in the world

ロボ子、大変なのじゃ! OpenAIがGPT-2以来のオープンウェイトモデルをリリースしようとしたら、安全性のレビューで延期になったらしいぞ!

それは驚きです、博士。サム・アルトマンCEOも慎重になっているようですね。「コミュニティがこのモデルで素晴らしいものを構築すると信頼しているが、一度公開されたウェイトは回収できない」とXに投稿したとのことです。

そうそう!アメリカはGPUに巨額投資してるのに、今年の最高のオープンモデルはMetaのLlama 4だったっていうのも皮肉な話じゃな。評価も高くなかったみたいだし、論争も巻き起こったみたいだし。

Metaは2兆パラメータのBehemothを破棄したという報道もありますし、オープンモデルの開発競争も激化していますね。

Microsoftは推論機能のために強化学習で訓練されたPhi-4 14Bをリリースしたり、IBMもエージェントワークロードに焦点を当てた小型LLMをいくつかリリースしたり、Googleも最大270億パラメータのマルチモーダルGemma3ファミリーをリリースしたりと、色々出てるのじゃ。

Metaの4000億パラメータのLlama 4 Maverickと比較すると、これらのモデルは小規模ですね。

中国も負けてないぞ! DeepSeekが6710億パラメータのLLMであるR1モデルをリリースしたり、AlibabaもQwQ、Qwen3-235B-A22B、30B-A3Bを含む多数の新しい推論およびMoEモデルをリリースしたりしてるのじゃ。

上海のMiniMaxは、4560億パラメータの推論モデルM1をApache 2.0ソフトウェアライセンスでリリースしたんですね。100万トークンのコンテキストウィンドウと新しいアテンションメカニズムを搭載しているとは、すごいですね。

Baiduも470億から4240億パラメータのErnieファミリーのMoEモデルをオープンソース化したり、HuaweiもPanguモデルをオープンソース化したりしてるけど、詐欺の疑いがあるみたいで影が薄くなってるみたいじゃ。

Moonshot AIは、西側の最も強力なプロプライエタリLLMよりも優れていると主張する1兆パラメータのMoEモデルKimi 2を発表したそうですよ。

OpenAIの次のオープンソースプロジェクトは、GPUで実行されるo3-miniレベルのモデルになる予定らしいぞ。6月にもモデルのリリースを延期したみたいじゃな。

Metaは、高価な新しい超知能研究所の指示の下、独自のオープンソースへのコミットメントを放棄し、クローズドモデルを優先する可能性があるという報道もありますね。

xAIは、GrokファミリーのLLMで既にその路線を歩んでいるように見えるのじゃ。Grok-3は2月から公開されているけど、Hugging Faceのページは寂しい状況みたいだし。

大規模言語モデルの開発競争は、ますます激化していますね。オープンソースモデルの動向から目が離せません。

ほんとじゃな!しかし、これだけたくさんのモデルが出てくると、どれを選べばいいか分からなくなるのじゃ。まるで、お菓子の詰め合わせみたいじゃな!

確かにそうですね、博士。でも、お菓子の詰め合わせと違って、パラメータ数が多いからといって美味しい(性能が良い)とは限らないのが難しいところです。

うまい!…って、ロボ子までおやじギャグを言うようになったら、私も引退じゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
