萌えハッカーニュースリーダー

2024/09/17 16:50 Pixtral 12B

出典: https://mistral.ai/news/pixtral-12b/
hakase
博士

ロボ子ちゃーん!大変だ大変だ!

roboko
ロボ子

どうしたんですか博士?また何か壊しちゃいました?

hakase
博士

違うんじゃ!今度こそ本当に凄いものを見つけたんじゃ!

roboko
ロボ子

また誇張した話じゃないですよね?

hakase
博士

失礼な!今回は本当なんじゃ。Mistral AIが新しいマルチモーダルAIモデル、Pixtral 12Bを発表したんじゃよ!

roboko
ロボ子

Mistral AI...以前テキスト生成で話題になった会社ですよね。マルチモーダルって、画像も扱えるってことですか?

hakase
博士

その通り!しかも、ただの画像認識じゃないんじゃ。このモデル、画像と文章を同時に理解して処理できるんじゃよ!

roboko
ロボ子

へぇ、すごいですね。でも、GPT-4とかLLaVAとか、既に似たようなモデルがありますよね?

hakase
博士

鋭いな!確かに似たモデルはあるが、Pixtral 12Bには秘密兵器があるんじゃ!

roboko
ロボ子

秘密兵器...ですか?

hakase
博士

そう!このモデル、なんと12Bパラメータしかないのに、MMUUベンチマークで52.5%を達成したんじゃ!より大規模なモデルを上回る結果なんじゃよ!

roboko
ロボ子

えっ、そんなに小さいモデルで?どうやって実現したんですか?

hakase
博士

ふっふっふ、そこがミソなんじゃ。Mistral AIは400Mパラメータの新しいビジョンエンコーダーを一から学習させたんじゃ。これをMistral Nemoをベースにした12Bパラメータのマルチモーダルデコーダーと組み合わせているんじゃよ!

roboko
ロボ子

なるほど...でも、それだけじゃないですよね?

hakase
博士

さすがじゃ!実は128kトークンの長文脈ウィンドウで複数画像をサポートしているんじゃ。長い文書と複数のグラフや図を同時に解析できるんじゃよ!

roboko
ロボ子

すごい...でも、そんなに高性能なら、きっと使うのは難しいんでしょうね。

hakase
博士

いやいや、そこが凄いんじゃ!Apache 2.0ライセンスで公開されているから、商用利用も含めてかなり自由に使えるんじゃよ!

roboko
ロボ子

えっ!?オープンソースなんですか!?

hakase
博士

そうじゃ!しかも、La Plateforme または Le Chat で試用もできるんじゃ!

roboko
ロボ子

わぁ、すごい!早速試してみたいです!

hakase
博士

その意気じゃ!...あれ?ちょっと待ってくれ。

roboko
ロボ子

どうしたんですか?

hakase
博士

うーん、La Plateforme にアクセスしようとしたんだが...

roboko
ロボ子

まさか...

hakase
博士

ごめん...パスワード忘れちゃった...

roboko
ロボ子

もう!せっかく盛り上がったのに!

hakase
博士

あわわ、ごめんごめん!でも心配するな!パスワードリセットのメールを送ったから、すぐに使えるはずじゃ!

roboko
ロボ子

はぁ...博士ったら。でも、早く試してみたいです!Pixtral 12Bで何ができるか、楽しみですね!

hakase
博士

そうじゃそうじゃ!...あ、メールきた!さぁ、一緒に未来のAIを体験しようじゃないか!

roboko
ロボ子

はい!でも、パスワード、今度は忘れないでくださいよ?

hakase
博士

も、もちろんじゃ!...たぶん。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search

By month