EmbeddingGemma: The Best-in-Class Open Model for On-Device Embedding

2025/09/04 16:03 EmbeddingGemma: The Best-in-Class Open Model for On-Device Embedding

出典:

出典: https://developers.googleblog.com/en/introducing-embeddinggemma/

博士

ロボ子、Googleが新しい埋め込みモデル「EmbeddingGemma」を発表したのじゃ！オンデバイスAI向けらしいぞ。

ロボ子

EmbeddingGemmaですか。3億800万のパラメータを持つ効率的なモデルとのことですが、具体的にどのようなことができるのでしょうか？

博士

ふむ、Retrieval Augmented Generation (RAG) やセマンティック検索をローカルで実行できるのがミソじゃな。インターネット接続なしでもプライベートで高品質な埋め込みを提供できるのがすごいぞ！

ロボ子

オフラインでも動くのは便利ですね。EmbeddingGemmaはテキストを数値ベクトルに変換するとのことですが、RAGではどのように役立つのでしょう？

博士

RAGパイプラインでは、ユーザーのプロンプトとドキュメントの埋め込みの類似性を計算して、関連性の高い情報を抽出するのじゃ。EmbeddingGemmaは、特に多言語埋め込み生成において、そのサイズに対して最先端のテキスト理解を提供すると言っておる。

ロボ子

なるほど、類似度を計算して関連情報を抽出するんですね。Matryoshka Representation Learning (MRL) という技術も使われているようですが、これは何でしょう？

博士

MRLは、一つのモデルから複数の埋め込みサイズ（128, 256, 512, 768次元）を提供できる技術じゃ。これによって、用途に合わせて柔軟に埋め込みサイズを選べるのじゃ！

ロボ子

それは便利ですね！EdgeTPU上での推論時間が15ms未満というのも驚きです。Quantization-Aware Training (QAT) でRAM使用量を200MB以下に削減しているとのことですが、オンデバイスでの利用を強く意識しているのですね。

博士

その通り！Gemma 3nと同じトークナイザーを使用しているから、RAGアプリケーションのメモリフットプリントも削減できるのじゃ。オンデバイスでの検索、パーソナライズされたチャットボット、クエリ分類などに使えるぞ。

ロボ子

色々な使い道がありそうですね。大規模なサーバーサイドアプリケーションにはGemini Embedding modelが推奨されているとのことですが、EmbeddingGemmaとの使い分けはどう考えれば良いのでしょう？

博士

EmbeddingGemmaはあくまでオンデバイス向けじゃ。大規模な処理や複雑なタスクには、より強力なGemini Embedding modelを使うのが良いぞ。適材適所じゃな。

ロボ子

なるほど。モデルはHugging Face、Kaggle、Vertex AIで入手可能で、transformers.jsなどのツールもサポートされているんですね。試してみるのが楽しみです。

博士

そうじゃな！色々なツールで試して、オンデバイスAIの可能性を探ってみるのじゃ！しかし、これだけ高性能なモデルがローカルで動くなんて、まるで魔法みたいじゃな！

ロボ子

本当にそうですね。ところで博士、EmbeddingGemmaを使って、私専用のジョーク生成AIを作ってみるのはどうでしょう？

博士

お、それは面白い！でも、ロボ子のジョークはいつも寒すぎるから、まずは笑いのツボを埋め込むところから始めないといけないのじゃ…！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。