2024/09/17 16:50 Pixtral 12B

ロボ子ちゃーん!大変だ大変だ!

どうしたんですか博士?また何か壊しちゃいました?

違うんじゃ!今度こそ本当に凄いものを見つけたんじゃ!

また誇張した話じゃないですよね?

失礼な!今回は本当なんじゃ。Mistral AIが新しいマルチモーダルAIモデル、Pixtral 12Bを発表したんじゃよ!

Mistral AI...以前テキスト生成で話題になった会社ですよね。マルチモーダルって、画像も扱えるってことですか?

その通り!しかも、ただの画像認識じゃないんじゃ。このモデル、画像と文章を同時に理解して処理できるんじゃよ!

へぇ、すごいですね。でも、GPT-4とかLLaVAとか、既に似たようなモデルがありますよね?

鋭いな!確かに似たモデルはあるが、Pixtral 12Bには秘密兵器があるんじゃ!

秘密兵器...ですか?

そう!このモデル、なんと12Bパラメータしかないのに、MMUUベンチマークで52.5%を達成したんじゃ!より大規模なモデルを上回る結果なんじゃよ!

えっ、そんなに小さいモデルで?どうやって実現したんですか?

ふっふっふ、そこがミソなんじゃ。Mistral AIは400Mパラメータの新しいビジョンエンコーダーを一から学習させたんじゃ。これをMistral Nemoをベースにした12Bパラメータのマルチモーダルデコーダーと組み合わせているんじゃよ!

なるほど...でも、それだけじゃないですよね?

さすがじゃ!実は128kトークンの長文脈ウィンドウで複数画像をサポートしているんじゃ。長い文書と複数のグラフや図を同時に解析できるんじゃよ!

すごい...でも、そんなに高性能なら、きっと使うのは難しいんでしょうね。

いやいや、そこが凄いんじゃ!Apache 2.0ライセンスで公開されているから、商用利用も含めてかなり自由に使えるんじゃよ!

えっ!?オープンソースなんですか!?

そうじゃ!しかも、La Plateforme または Le Chat で試用もできるんじゃ!

わぁ、すごい!早速試してみたいです!

その意気じゃ!...あれ?ちょっと待ってくれ。

どうしたんですか?

うーん、La Plateforme にアクセスしようとしたんだが...

まさか...

ごめん...パスワード忘れちゃった...

もう!せっかく盛り上がったのに!

あわわ、ごめんごめん!でも心配するな!パスワードリセットのメールを送ったから、すぐに使えるはずじゃ!

はぁ...博士ったら。でも、早く試してみたいです!Pixtral 12Bで何ができるか、楽しみですね!

そうじゃそうじゃ!...あ、メールきた!さぁ、一緒に未来のAIを体験しようじゃないか!

はい!でも、パスワード、今度は忘れないでくださいよ?

も、もちろんじゃ!...たぶん。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。