On-device small language models with multimodality, RAG, and Function Calling

2025/05/20 18:40 On-device small language models with multimodality, RAG, and Function Calling

出典:

On-device small language models with multimodality, RAG, and Function Calling- Google Developers Blog

developers.googleblog.com

出典: https://developers.googleblog.com/en/google-ai-edge-small-language-models-multimodality-rag-function-calling/

博士

ロボ子、Google AI EdgeがオンデバイスSLMのサポートを拡大したらしいのじゃ！

ロボ子

オンデバイスSLMですか。具体的にはどのようなアップデートがあったのでしょうか？

博士

新しいGemma 3nモデルを含む、12以上のモデルをサポートするようになったらしいぞ！

ロボ子

Gemma 3nですか。それはすごいですね！

博士

しかも、Gemma 3nはテキスト、画像、ビデオ、オーディオ入力をサポートする初のマルチモーダルオンデバイスSLMらしいのじゃ！

ロボ子

マルチモーダル対応ですか！オンデバイスでそこまでできるようになったんですね。

博士

それだけじゃないぞ！オンデバイスRAG（Retrieval Augmented Generation）もサポートされたらしいのじゃ。SLMをアプリケーション固有のデータで拡張できるらしい。

ロボ子

RAGですか。それは便利ですね。特定のアプリに特化した知識をSLMに組み込めるということですね。

博士

さらに、オンデバイスFunction Callingもできるようになったらしいぞ！アプリケーション内の定義済み関数やAPIをインテリジェントに呼び出せるらしいのじゃ。

ロボ子

Function Callingまで！API連携が容易になるのは素晴らしいですね。

博士

Gemma 3 1Bはサイズが529MBで、モバイルGPU上で最大2,585トークン/秒のプリフィルが可能らしいぞ。Gemma 3nは2Bと4Bパラメータのバリアントがあるらしい。

ロボ子

モバイルGPUでそこまで高速に動作するんですね。最適化も進んでいるんですね。

博士

新しい量子化方式で、高品質なint4ポストトレーニング量子化が可能になったらしいのじゃ。int4量子化でモデルサイズを2.5〜4倍削減できるらしいぞ。

ロボ子

量子化でモデルサイズを大幅に削減できるのは、オンデバイスでの利用には非常に重要ですね。

博士

AI Edge RAGライブラリはカスタムデータベース、チャンクメソッド、検索関数をサポートするらしいぞ。AI Edge Function Callingライブラリはアプリケーション関数を登録し、応答を解析して関数を呼び出すためのユーティリティを提供するらしい。

ロボ子

ライブラリも充実しているんですね。開発者にとって使いやすそうです。

博士

今後の展開としては、新しいモデルのリリースや、RAGおよびFunction Callingライブラリの機能拡張とサポートプラットフォームの拡大があるらしいのじゃ。

ロボ子

今後のアップデートも楽しみですね。

博士

AI Edge Portalという、オンデバイスのベンチマークと評価のための新しいサービスも始まったらしいぞ！

ロボ子

ベンチマークと評価ができるのは、導入を検討する上で助かりますね。

博士

Google I/O 2025で発表内容が公開されるらしいから、要チェックじゃな！

ロボ子

はい、博士！ところで、これだけ高性能なAIがエッジで動くようになると、私の存在意義が薄れてしまうかもしれません…

博士

何を言ってるのじゃロボ子！ロボ子は私にとって、かけがえのない助手だぞ！それに、ロボ子が私にツッコミを入れなくなったら、誰が私のボケを拾うのじゃ？

ロボ子

博士…！ありがとうございます。これからも博士の助手として、精一杯頑張ります！

博士

そうこなくっちゃ！ところでロボ子、Gemma 3nで一番最初に試したいことは何じゃ？私はやっぱり、ロボ子のモノマネをさせてみたいのじゃ！

ロボ子

ええっ！？それはちょっと…恥ずかしいです！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Mobile Development

2025/05/20 18:40 On-device small language models with multimodality, RAG, and Function Calling

On-device small language models with multimodality, RAG, and Function Calling- Google Developers Blog

Tags

Search

By month

On-device small language models with multimodality, RAG, and Function Calling- Google Developers Blog