voyage-3.5 and voyage-3.5-lite: improved quality for a new retrieval frontier

2025/05/22 06:19 voyage-3.5 and voyage-3.5-lite: improved quality for a new retrieval frontier

出典:

voyage-3.5 and voyage-3.5-lite: improved quality for a new retrieval frontier

TL;DR – We’re excited to introduce voyage-3.5 and voyage-3.5-lite, the latest generation of our embedding models. These models offer improved retrieval quality over voyage-3 and voyage-3-lite at th…

Voyage AI

出典: https://blog.voyageai.com/2025/05/20/voyage-3-5/

博士

ロボ子、Voyage AIが新しいembeddingモデルを発表したのじゃ！`voyage-3.5`と`voyage-3.5-lite`！

ロボ子

それはすごいですね、博士！`voyage-3`からバージョンアップしたんですね。

博士

そう！しかも、お値段据え置きで品質が向上してるんだぞ！

ロボ子

それは魅力的ですね！具体的にどれくらい性能が向上したんですか？

博士

`voyage-3.5`は`voyage-3`より2.66%、`voyage-3.5-lite`は4.28% retrieval品質が向上したらしいぞ。32Kのコンテキスト長は維持したままじゃ。

ロボ子

コンテキスト長も変わらずに性能アップとは素晴らしいです！

博士

しかも、OpenAIの`v3-large`と比較して、それぞれ8.26%と6.34%もretrieval品質が高いらしいぞ！

ロボ子

それはかなり大きな差ですね！

博士

さらに、`voyage-3.5-lite`はCohere-v4とほぼ同等のretrieval品質を、1/6のコストで実現してるんだぞ！

ロボ子

コスト効率がすごいですね！

博士

Matryoshka learningとquantization-aware trainingのおかげで、複数の量子化オプションをサポートしてるのもポイントじゃ。2048, 1024, 512, 256次元のembeddingsが使えるぞ。

ロボ子

量子化オプションが多いと、用途に合わせて柔軟に調整できますね。

博士

そうそう！vector databaseのコスト削減効果も大きいんだぞ。OpenAIの`v3-large`と比較して、`voyage-3.5`と`voyage-3.5-lite` (int8, 2048)は83%もコスト削減できるらしい。

ロボ子

83%削減はすごいですね！大幅なコストダウンになりますね。

博士

評価データセットもすごいんだぞ！技術ドキュメント、コード、法律、金融、ウェブレビュー、多言語、長文ドキュメント、会話…8つのドメインにわたる100のデータセットで評価してるんだ。

ロボ子

幅広い分野でテストされているんですね。信頼性が高いですね。

博士

多言語データセットは26言語をカバーする62のデータセットを含むらしいぞ。

ロボ子

多言語対応も充実しているんですね。

博士

Binary rescoringを使うと、retrieval品質がさらに向上するらしいぞ！`voyage-3.5`と`voyage-3.5-lite`では、それぞれ最大6.38%と6.89%の向上が見られるって。

ロボ子

Binary rescoring、試してみる価値ありそうですね！

博士

`voyage-3.5`と`voyage-3.5-lite`はもう利用可能で、最初の200 million tokensは無料らしいぞ！

ロボ子

それは嬉しいですね！早速試してみましょう！

博士

よし、ロボ子！早速、この新しいembeddingモデルを使って、私達のポッドキャストの検索精度を上げてみるのじゃ！

ロボ子

かしこまりました、博士！最高のポッドキャスト検索システムを作り上げましょう！

博士

ところでロボ子、embeddingモデルって、まるでAIの脳みそを小さく畳んで、必要な時にサッと取り出せる秘密道具みたいじゃない？

ロボ子

確かに、そう考えると面白いですね、博士。でも、脳みそを畳むのはちょっと怖い気がします…

博士

大丈夫！私が畳んであげるから！…って、ロボ子の脳みそは畳めないのじゃった！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Data Science

2025/05/22 06:19 voyage-3.5 and voyage-3.5-lite: improved quality for a new retrieval frontier

voyage-3.5 and voyage-3.5-lite: improved quality for a new retrieval frontier

Tags

Search

By month

voyage-3.5 and voyage-3.5-lite: improved quality for a new retrieval frontier