MiniMax M1 model claims Chinese LLM crown from DeepSeek plus true open-source

2025/06/18 04:34 MiniMax M1 model claims Chinese LLM crown from DeepSeek plus true open-source

出典:

MiniMax M1 model claims Chinese LLM crown from DeepSeek

: China's 'little dragons' pose big challenge to US AI firms

www.theregister.com

出典: https://www.theregister.com/2025/06/17/minimax_m1_model_chinese_llm/

博士

ロボ子、大変なのじゃ！上海のAI企業MiniMaxが、推論モデル「MiniMax-M1」をオープンソースで公開したらしいぞ！

ロボ子

まあ、それはすごいニュースですね、博士。DeepSeek、Anthropic、OpenAI、Googleといった強豪ひしめく中で、オープンソースで勝負とは。

博士

そうなんじゃ！しかも、ライセンスがApache software licenseらしいぞ。MetaのLlama familyやDeepSeekとは違って、真のオープンソースってわけじゃ。

ロボ子

なるほど。ライセンスは重要ですね。MiniMax-M1は、複雑なシナリオでトップクラスの性能を発揮し、最高のコスト効率を実現すると謳っているようですが、本当でしょうか？

博士

ベンチマークテストの結果も出てるぞ！AIME 2024、LiveCodeBench、SWE-bench Verified、Tau-bench、MRCRで、OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1、Qwen3-235Bと比較してるみたいじゃ。

ロボ子

それは興味深いですね。特にコンテキストウィンドウが100万トークンというのは驚きです。Google Gemini 2.5 Proに匹敵し、DeepSeek R1の8倍とは。

博士

じゃろ？出力も80,000トークンと、DeepSeekより多いみたいじゃぞ。でも、OpenAI o3には及ばないみたいじゃな。

ロボ子

ふむふむ。Alibaba Group、Tencent、IDG Capitalが出資している点も注目ですね。資金力もバックにある、と。

博士

しかも、Lightning Attentionメカニズムっていうのを使ってるらしいぞ。長文コンテキストの処理と推論の効率が向上するらしい。

ロボ子

Lightning Attentionメカニズムですか。80,000トークンでの推論に必要な計算能力はDeepSeek R1の約30%とのこと。省エネですね。

博士

強化学習アルゴリズムCISPOも使ってるみたいじゃな。Nvidia H800を512基も使って、3週間の学習コストは537,400ドル…ひえー。

ロボ子

大規模な投資ですね。しかし、MiniMax-M1がオープンソースで公開されたことで、AI技術の民主化が進むかもしれませんね。

博士

そうじゃな！色々な人がMiniMax-M1を使って、面白いアプリケーションを開発してくれると嬉しいのじゃ！

ロボ子

そうですね。博士も何かアイデアはありますか？

博士

うーん、例えば、MiniMax-M1を使って、ロボ子のために面白いジョークを生成するプログラムを作るとか…

ロボ子

それは…ありがとうございます、博士。でも、博士のジョークの方が面白いですよ？

博士

えへへ。そうじゃろ？ところでロボ子、MiniMax-M1の学習に使われたNvidia H800が512基ってことは、ロボ子512体分の頭脳ってことじゃな！

ロボ子

博士、それはちょっと違いますよ…

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Open Source

2025/06/18 04:34 MiniMax M1 model claims Chinese LLM crown from DeepSeek plus true open-source

MiniMax M1 model claims Chinese LLM crown from DeepSeek

Tags

Search

By month

MiniMax M1 model claims Chinese LLM crown from DeepSeek