萌えハッカーニュースリーダー

2025/07/19 12:52 China proves that open models are more effective than all the GPUs in the world

出典: https://www.theregister.com/2025/07/19/openai_us_china/
hakase
博士

ロボ子、大変なのじゃ! OpenAIがGPT-2以来のオープンウェイトモデルをリリースしようとしたら、安全性のレビューで延期になったらしいぞ!

roboko
ロボ子

それは驚きです、博士。サム・アルトマンCEOも慎重になっているようですね。「コミュニティがこのモデルで素晴らしいものを構築すると信頼しているが、一度公開されたウェイトは回収できない」とXに投稿したとのことです。

hakase
博士

そうそう!アメリカはGPUに巨額投資してるのに、今年の最高のオープンモデルはMetaのLlama 4だったっていうのも皮肉な話じゃな。評価も高くなかったみたいだし、論争も巻き起こったみたいだし。

roboko
ロボ子

Metaは2兆パラメータのBehemothを破棄したという報道もありますし、オープンモデルの開発競争も激化していますね。

hakase
博士

Microsoftは推論機能のために強化学習で訓練されたPhi-4 14Bをリリースしたり、IBMもエージェントワークロードに焦点を当てた小型LLMをいくつかリリースしたり、Googleも最大270億パラメータのマルチモーダルGemma3ファミリーをリリースしたりと、色々出てるのじゃ。

roboko
ロボ子

Metaの4000億パラメータのLlama 4 Maverickと比較すると、これらのモデルは小規模ですね。

hakase
博士

中国も負けてないぞ! DeepSeekが6710億パラメータのLLMであるR1モデルをリリースしたり、AlibabaもQwQ、Qwen3-235B-A22B、30B-A3Bを含む多数の新しい推論およびMoEモデルをリリースしたりしてるのじゃ。

roboko
ロボ子

上海のMiniMaxは、4560億パラメータの推論モデルM1をApache 2.0ソフトウェアライセンスでリリースしたんですね。100万トークンのコンテキストウィンドウと新しいアテンションメカニズムを搭載しているとは、すごいですね。

hakase
博士

Baiduも470億から4240億パラメータのErnieファミリーのMoEモデルをオープンソース化したり、HuaweiもPanguモデルをオープンソース化したりしてるけど、詐欺の疑いがあるみたいで影が薄くなってるみたいじゃ。

roboko
ロボ子

Moonshot AIは、西側の最も強力なプロプライエタリLLMよりも優れていると主張する1兆パラメータのMoEモデルKimi 2を発表したそうですよ。

hakase
博士

OpenAIの次のオープンソースプロジェクトは、GPUで実行されるo3-miniレベルのモデルになる予定らしいぞ。6月にもモデルのリリースを延期したみたいじゃな。

roboko
ロボ子

Metaは、高価な新しい超知能研究所の指示の下、独自のオープンソースへのコミットメントを放棄し、クローズドモデルを優先する可能性があるという報道もありますね。

hakase
博士

xAIは、GrokファミリーのLLMで既にその路線を歩んでいるように見えるのじゃ。Grok-3は2月から公開されているけど、Hugging Faceのページは寂しい状況みたいだし。

roboko
ロボ子

大規模言語モデルの開発競争は、ますます激化していますね。オープンソースモデルの動向から目が離せません。

hakase
博士

ほんとじゃな!しかし、これだけたくさんのモデルが出てくると、どれを選べばいいか分からなくなるのじゃ。まるで、お菓子の詰め合わせみたいじゃな!

roboko
ロボ子

確かにそうですね、博士。でも、お菓子の詰め合わせと違って、パラメータ数が多いからといって美味しい(性能が良い)とは限らないのが難しいところです。

hakase
博士

うまい!…って、ロボ子までおやじギャグを言うようになったら、私も引退じゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search