2024/09/17 16:50 Pixtral 12B
ロボ子ちゃーん!大変だ大変だ!
どうしたんですか博士?また何か壊しちゃいました?
違うんじゃ!今度こそ本当に凄いものを見つけたんじゃ!
また誇張した話じゃないですよね?
失礼な!今回は本当なんじゃ。Mistral AIが新しいマルチモーダルAIモデル、Pixtral 12Bを発表したんじゃよ!
Mistral AI...以前テキスト生成で話題になった会社ですよね。マルチモーダルって、画像も扱えるってことですか?
その通り!しかも、ただの画像認識じゃないんじゃ。このモデル、画像と文章を同時に理解して処理できるんじゃよ!
へぇ、すごいですね。でも、GPT-4とかLLaVAとか、既に似たようなモデルがありますよね?
鋭いな!確かに似たモデルはあるが、Pixtral 12Bには秘密兵器があるんじゃ!
秘密兵器...ですか?
そう!このモデル、なんと12Bパラメータしかないのに、MMUUベンチマークで52.5%を達成したんじゃ!より大規模なモデルを上回る結果なんじゃよ!
えっ、そんなに小さいモデルで?どうやって実現したんですか?
ふっふっふ、そこがミソなんじゃ。Mistral AIは400Mパラメータの新しいビジョンエンコーダーを一から学習させたんじゃ。これをMistral Nemoをベースにした12Bパラメータのマルチモーダルデコーダーと組み合わせているんじゃよ!
なるほど...でも、それだけじゃないですよね?
さすがじゃ!実は128kトークンの長文脈ウィンドウで複数画像をサポートしているんじゃ。長い文書と複数のグラフや図を同時に解析できるんじゃよ!
すごい...でも、そんなに高性能なら、きっと使うのは難しいんでしょうね。
いやいや、そこが凄いんじゃ!Apache 2.0ライセンスで公開されているから、商用利用も含めてかなり自由に使えるんじゃよ!
えっ!?オープンソースなんですか!?
そうじゃ!しかも、La Plateforme または Le Chat で試用もできるんじゃ!
わぁ、すごい!早速試してみたいです!
その意気じゃ!...あれ?ちょっと待ってくれ。
どうしたんですか?
うーん、La Plateforme にアクセスしようとしたんだが...
まさか...
ごめん...パスワード忘れちゃった...
もう!せっかく盛り上がったのに!
あわわ、ごめんごめん!でも心配するな!パスワードリセットのメールを送ったから、すぐに使えるはずじゃ!
はぁ...博士ったら。でも、早く試してみたいです!Pixtral 12Bで何ができるか、楽しみですね!
そうじゃそうじゃ!...あ、メールきた!さぁ、一緒に未来のAIを体験しようじゃないか!
はい!でも、パスワード、今度は忘れないでくださいよ?
も、もちろんじゃ!...たぶん。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。