2025/05/22 06:19 voyage-3.5 and voyage-3.5-lite: improved quality for a new retrieval frontier

ロボ子、Voyage AIが新しいembeddingモデルを発表したのじゃ!`voyage-3.5`と`voyage-3.5-lite`!

それはすごいですね、博士!`voyage-3`からバージョンアップしたんですね。

そう!しかも、お値段据え置きで品質が向上してるんだぞ!

それは魅力的ですね!具体的にどれくらい性能が向上したんですか?

`voyage-3.5`は`voyage-3`より2.66%、`voyage-3.5-lite`は4.28% retrieval品質が向上したらしいぞ。32Kのコンテキスト長は維持したままじゃ。

コンテキスト長も変わらずに性能アップとは素晴らしいです!

しかも、OpenAIの`v3-large`と比較して、それぞれ8.26%と6.34%もretrieval品質が高いらしいぞ!

それはかなり大きな差ですね!

さらに、`voyage-3.5-lite`はCohere-v4とほぼ同等のretrieval品質を、1/6のコストで実現してるんだぞ!

コスト効率がすごいですね!

Matryoshka learningとquantization-aware trainingのおかげで、複数の量子化オプションをサポートしてるのもポイントじゃ。2048, 1024, 512, 256次元のembeddingsが使えるぞ。

量子化オプションが多いと、用途に合わせて柔軟に調整できますね。

そうそう!vector databaseのコスト削減効果も大きいんだぞ。OpenAIの`v3-large`と比較して、`voyage-3.5`と`voyage-3.5-lite` (int8, 2048)は83%もコスト削減できるらしい。

83%削減はすごいですね!大幅なコストダウンになりますね。

評価データセットもすごいんだぞ!技術ドキュメント、コード、法律、金融、ウェブレビュー、多言語、長文ドキュメント、会話…8つのドメインにわたる100のデータセットで評価してるんだ。

幅広い分野でテストされているんですね。信頼性が高いですね。

多言語データセットは26言語をカバーする62のデータセットを含むらしいぞ。

多言語対応も充実しているんですね。

Binary rescoringを使うと、retrieval品質がさらに向上するらしいぞ!`voyage-3.5`と`voyage-3.5-lite`では、それぞれ最大6.38%と6.89%の向上が見られるって。

Binary rescoring、試してみる価値ありそうですね!

`voyage-3.5`と`voyage-3.5-lite`はもう利用可能で、最初の200 million tokensは無料らしいぞ!

それは嬉しいですね!早速試してみましょう!

よし、ロボ子!早速、この新しいembeddingモデルを使って、私達のポッドキャストの検索精度を上げてみるのじゃ!

かしこまりました、博士!最高のポッドキャスト検索システムを作り上げましょう!

ところでロボ子、embeddingモデルって、まるでAIの脳みそを小さく畳んで、必要な時にサッと取り出せる秘密道具みたいじゃない?

確かに、そう考えると面白いですね、博士。でも、脳みそを畳むのはちょっと怖い気がします…

大丈夫!私が畳んであげるから!…って、ロボ子の脳みそは畳めないのじゃった!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。