2025/05/20 18:29 Announcing Gemma 3n preview: powerful, efficient, mobile-first AI

ロボ子、大変なのじゃ!Googleが次世代オンデバイスAIのための新しいアーキテクチャを開発したらしいぞ!

それはすごいですね、博士!Qualcomm、MediaTek、Samsung System LSIと協力しているとのことですが、どのような点が新しいのでしょうか?

ふむ、どうやら高速なマルチモーダルAIに最適化されているらしいのじゃ。つまり、音声もテキストも画像も、全部まとめてサクサク処理できるってことだぞ!

マルチモーダルAIですか。具体的にはどのような応用が考えられますか?

例えば、リアルタイムで視覚的・聴覚的な合図を理解して応答するインタラクティブな体験が作れるらしいぞ。それに、音声、画像、ビデオ、テキスト入力を組み合わせて、コンテキストに応じたテキスト生成もできるみたいじゃ。

なるほど。記事には「Gemma 3n」というモデルが紹介されていますね。これはその新しいアーキテクチャに基づく初のオープンモデルとのことですが。

そうそう!Gemma 3nは、AndroidとChromeで利用可能になるGemini Nanoの次世代版にも搭載されるらしいぞ。楽しみじゃ!

Gemma 3nは、Google DeepMindのPer-Layer Embeddings (PLE)技術を活用してRAM使用量を削減しているとのことですが、具体的にどのくらい削減されるのでしょうか?

動的なメモリフットプリントは2GBと3GBらしいぞ。Gemma 3 4Bと比較して、モバイルでの応答速度が約1.5倍向上するらしいから、かなり効率的になっているのじゃな。

オフライン環境でも利用可能とのことですが、どのような場面で役立ちますか?

電波が届かない場所でもAIが使えるってことじゃから、災害時とか、山奥で遭難した時とかに役立つかもしれないぞ!

なるほど、それは便利ですね。音声、テキスト、画像を理解・処理可能で、高品質な自動音声認識と翻訳もできるとのことですが、多言語対応も向上しているのでしょうか?

WMT24++で50.1%の性能が出ているらしいぞ。これは期待できるのじゃ!

開発者はGemma 3nを活用して、リアルタイムの音声文字起こし、翻訳、高度な音声駆動型インタラクションなど、高度な音声中心のアプリケーションを開発できるとのことですね。

そうじゃ!Google AI StudioとGoogle AI Edgeを通じてプレビュー版が提供されているから、ロボ子も試してみるといいぞ!

ありがとうございます、博士。試してみます!

Google I/O 2025で発表されたらしいから、来年の発表も楽しみじゃな!

そうですね!ところで博士、Gemma 3nを使って何か面白いアプリのアイデアはありますか?

うむ、そうじゃな…例えば、ロボ子の夢をAIが分析して、その内容を元にオリジナルストーリーを自動生成するアプリはどうじゃ?

私の夢ですか…なんだか少し恥ずかしいですね。

大丈夫じゃ、大丈夫じゃ!AIがうまくやってくれるぞ!…まあ、ロボ子の夢が「博士に怒られる夢」だったら、ちょっと気まずいのじゃが…
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。