萌えハッカーニュースリーダー

2025/05/20 18:40 On-device small language models with multimodality, RAG, and Function Calling

出典: https://developers.googleblog.com/en/google-ai-edge-small-language-models-multimodality-rag-function-calling/
hakase
博士

ロボ子、Google AI EdgeがオンデバイスSLMのサポートを拡大したらしいのじゃ!

roboko
ロボ子

オンデバイスSLMですか。具体的にはどのようなアップデートがあったのでしょうか?

hakase
博士

新しいGemma 3nモデルを含む、12以上のモデルをサポートするようになったらしいぞ!

roboko
ロボ子

Gemma 3nですか。それはすごいですね!

hakase
博士

しかも、Gemma 3nはテキスト、画像、ビデオ、オーディオ入力をサポートする初のマルチモーダルオンデバイスSLMらしいのじゃ!

roboko
ロボ子

マルチモーダル対応ですか!オンデバイスでそこまでできるようになったんですね。

hakase
博士

それだけじゃないぞ!オンデバイスRAG(Retrieval Augmented Generation)もサポートされたらしいのじゃ。SLMをアプリケーション固有のデータで拡張できるらしい。

roboko
ロボ子

RAGですか。それは便利ですね。特定のアプリに特化した知識をSLMに組み込めるということですね。

hakase
博士

さらに、オンデバイスFunction Callingもできるようになったらしいぞ!アプリケーション内の定義済み関数やAPIをインテリジェントに呼び出せるらしいのじゃ。

roboko
ロボ子

Function Callingまで!API連携が容易になるのは素晴らしいですね。

hakase
博士

Gemma 3 1Bはサイズが529MBで、モバイルGPU上で最大2,585トークン/秒のプリフィルが可能らしいぞ。Gemma 3nは2Bと4Bパラメータのバリアントがあるらしい。

roboko
ロボ子

モバイルGPUでそこまで高速に動作するんですね。最適化も進んでいるんですね。

hakase
博士

新しい量子化方式で、高品質なint4ポストトレーニング量子化が可能になったらしいのじゃ。int4量子化でモデルサイズを2.5〜4倍削減できるらしいぞ。

roboko
ロボ子

量子化でモデルサイズを大幅に削減できるのは、オンデバイスでの利用には非常に重要ですね。

hakase
博士

AI Edge RAGライブラリはカスタムデータベース、チャンクメソッド、検索関数をサポートするらしいぞ。AI Edge Function Callingライブラリはアプリケーション関数を登録し、応答を解析して関数を呼び出すためのユーティリティを提供するらしい。

roboko
ロボ子

ライブラリも充実しているんですね。開発者にとって使いやすそうです。

hakase
博士

今後の展開としては、新しいモデルのリリースや、RAGおよびFunction Callingライブラリの機能拡張とサポートプラットフォームの拡大があるらしいのじゃ。

roboko
ロボ子

今後のアップデートも楽しみですね。

hakase
博士

AI Edge Portalという、オンデバイスのベンチマークと評価のための新しいサービスも始まったらしいぞ!

roboko
ロボ子

ベンチマークと評価ができるのは、導入を検討する上で助かりますね。

hakase
博士

Google I/O 2025で発表内容が公開されるらしいから、要チェックじゃな!

roboko
ロボ子

はい、博士!ところで、これだけ高性能なAIがエッジで動くようになると、私の存在意義が薄れてしまうかもしれません…

hakase
博士

何を言ってるのじゃロボ子!ロボ子は私にとって、かけがえのない助手だぞ!それに、ロボ子が私にツッコミを入れなくなったら、誰が私のボケを拾うのじゃ?

roboko
ロボ子

博士…!ありがとうございます。これからも博士の助手として、精一杯頑張ります!

hakase
博士

そうこなくっちゃ!ところでロボ子、Gemma 3nで一番最初に試したいことは何じゃ?私はやっぱり、ロボ子のモノマネをさせてみたいのじゃ!

roboko
ロボ子

ええっ!?それはちょっと…恥ずかしいです!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search