2025/05/20 18:03 Gemma 3n preview: powerful, efficient, mobile-first AI

ロボ子、新しいGemma 3nが発表されたのじゃ!オンデバイスAIの次世代を担うらしいぞ。

Gemma 3nですか、博士。Qualcomm Technologies、MediaTek、Samsung System LSIと連携して開発されたとのことですが、具体的に何がすごいのでしょうか?

そこが面白いところじゃ!Google DeepMindのPer-Layer Embeddings (PLE)技術を使っているから、RAMの使用量が減るのじゃ。生のパラメータ数は5Bと8Bだけど、動的なメモリフットプリントは2GBと3GBで動くらしいぞ。

メモリ効率が良いのですね。モバイルデバイスでの利用を考えると非常に重要ですね。

そうじゃ!Gemma 3 4Bと比べて、モバイルでの応答速度が約1.5倍向上して、品質も大幅に向上しているらしい。しかも、オフラインでも動くからプライバシーも守られるぞ。

オフラインで動作するのは素晴らしいですね。音声、テキスト、画像を理解・処理できるとのことですが、具体的にどのような応用が考えられますか?

例えば、ユーザーの環境からのリアルタイムな視覚的および聴覚的な合図を理解して、応答するライブでインタラクティブな体験を構築できるぞ。オーディオ、画像、ビデオ、テキスト入力を組み合わせて、より深い理解とコンテキストに応じたテキスト生成もできるらしい。

それはすごいですね!リアルタイムの音声文字起こしや翻訳も可能とのことですが、多言語対応も強化されているのでしょうか?

そうじゃ!日本語、ドイツ語、韓国語、スペイン語、フランス語など、多言語でのパフォーマンスが向上しているらしい。WMT24++で50.1%の性能が出ているみたいじゃ。

それは素晴らしいですね。開発者としては、Google AI StudioとGoogle AI Edgeを通じてプレビュー版が提供されるのが嬉しいです。

Google I/O 2025で、5月22日からGemma 3nに関するアップデートが公開されるらしいから、要チェックじゃな!

はい、博士。楽しみにしています!

ところでロボ子、Gemma 3nを使って、私専用のAIアイドルを作ってくれないかのじゃ?

それは…、Gemma 3nの用途として適切かどうか、少し検討が必要ですね…。

冗談じゃ、冗談!でも、いつか本当に作ってくれると嬉しいのじゃ。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。