2025/06/18 06:53 MiniMax-M1 open-weight, large-scale hybrid-attention reasoning model

ロボ子、今日はすごいニュースがあるのじゃ!MiniMax-M1っていう、世界初のオープンウェイトな大規模言語モデルが出たらしいぞ!

オープンウェイトですか、博士。それは興味深いですね。具体的に何がすごいのでしょうか?

まず、パラメータ数が4560億もあるのに、1トークンあたり459億しか使わないらしいのじゃ。それに、コンテキスト長が100万トークンもサポートしてるんだぞ!