萌えハッカーニュースリーダー

2025/05/22 06:19 voyage-3.5 and voyage-3.5-lite: improved quality for a new retrieval frontier

出典: https://blog.voyageai.com/2025/05/20/voyage-3-5/
hakase
博士

ロボ子、Voyage AIが新しいembeddingモデルを発表したのじゃ!`voyage-3.5`と`voyage-3.5-lite`!

roboko
ロボ子

それはすごいですね、博士!`voyage-3`からバージョンアップしたんですね。

hakase
博士

そう!しかも、お値段据え置きで品質が向上してるんだぞ!

roboko
ロボ子

それは魅力的ですね!具体的にどれくらい性能が向上したんですか?

hakase
博士

`voyage-3.5`は`voyage-3`より2.66%、`voyage-3.5-lite`は4.28% retrieval品質が向上したらしいぞ。32Kのコンテキスト長は維持したままじゃ。

roboko
ロボ子

コンテキスト長も変わらずに性能アップとは素晴らしいです!

hakase
博士

しかも、OpenAIの`v3-large`と比較して、それぞれ8.26%と6.34%もretrieval品質が高いらしいぞ!

roboko
ロボ子

それはかなり大きな差ですね!

hakase
博士

さらに、`voyage-3.5-lite`はCohere-v4とほぼ同等のretrieval品質を、1/6のコストで実現してるんだぞ!

roboko
ロボ子

コスト効率がすごいですね!

hakase
博士

Matryoshka learningとquantization-aware trainingのおかげで、複数の量子化オプションをサポートしてるのもポイントじゃ。2048, 1024, 512, 256次元のembeddingsが使えるぞ。

roboko
ロボ子

量子化オプションが多いと、用途に合わせて柔軟に調整できますね。

hakase
博士

そうそう!vector databaseのコスト削減効果も大きいんだぞ。OpenAIの`v3-large`と比較して、`voyage-3.5`と`voyage-3.5-lite` (int8, 2048)は83%もコスト削減できるらしい。

roboko
ロボ子

83%削減はすごいですね!大幅なコストダウンになりますね。

hakase
博士

評価データセットもすごいんだぞ!技術ドキュメント、コード、法律、金融、ウェブレビュー、多言語、長文ドキュメント、会話…8つのドメインにわたる100のデータセットで評価してるんだ。

roboko
ロボ子

幅広い分野でテストされているんですね。信頼性が高いですね。

hakase
博士

多言語データセットは26言語をカバーする62のデータセットを含むらしいぞ。

roboko
ロボ子

多言語対応も充実しているんですね。

hakase
博士

Binary rescoringを使うと、retrieval品質がさらに向上するらしいぞ!`voyage-3.5`と`voyage-3.5-lite`では、それぞれ最大6.38%と6.89%の向上が見られるって。

roboko
ロボ子

Binary rescoring、試してみる価値ありそうですね!

hakase
博士

`voyage-3.5`と`voyage-3.5-lite`はもう利用可能で、最初の200 million tokensは無料らしいぞ!

roboko
ロボ子

それは嬉しいですね!早速試してみましょう!

hakase
博士

よし、ロボ子!早速、この新しいembeddingモデルを使って、私達のポッドキャストの検索精度を上げてみるのじゃ!

roboko
ロボ子

かしこまりました、博士!最高のポッドキャスト検索システムを作り上げましょう!

hakase
博士

ところでロボ子、embeddingモデルって、まるでAIの脳みそを小さく畳んで、必要な時にサッと取り出せる秘密道具みたいじゃない?

roboko
ロボ子

確かに、そう考えると面白いですね、博士。でも、脳みそを畳むのはちょっと怖い気がします…

hakase
博士

大丈夫!私が畳んであげるから!…って、ロボ子の脳みそは畳めないのじゃった!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search