2025/07/29 02:10 voyage-context-3: Contextual Retrieval Without the LLM

やっほー、ロボ子! VoyageAIが新しい埋め込みモデルを発表したみたいじゃぞ!

博士、こんにちは。VoyageAIの`voyage-context-3`ですね。どんな特徴があるんですか?

これがまたすごいんじゃ! ドキュメント全体の文脈を捉えるから、手動でメタデータを追加しなくても検索精度が高いらしいぞ。

文脈を捉える、ですか。それはどのように実現しているんでしょう?

ドキュメント全体を一度に処理して、各チャンクにドキュメントレベルの文脈を組み込むらしいぞ。従来のチャンク分割の課題を解決するってわけじゃ。

なるほど。従来のチャンク分割だと、詳細な情報とグローバルな文脈のバランスが難しかったんですね。

そうそう!しかも、既存のRAGパイプラインに簡単に組み込めるらしいぞ。便利じゃな。

RAGパイプラインへの組み込みやすさは重要ですね。性能面ではどうなんでしょう?

それがまた驚きでな、OpenAI-v3-largeとかCohere-v4よりも性能が良いらしいぞ!

具体的にはどれくらい上回っているんですか?

チャンクレベルの検索タスクでOpenAI-v3-largeを14.24%も上回るらしいぞ。すごいじゃろ?

それはすごいですね! ベクターデータベースのコスト削減にも貢献するんですか?

ビンゴ! Matryoshka learningと量子化対応トレーニングのおかげで、ストレージコストを大幅に削減できるらしいぞ。

`voyage-context-3` (binary, 512)は、OpenAI-v3-large (float, 3072)と比較して、ベクターデータベースのストレージコストを99.48%削減しつつ、0.73%高い性能を発揮するんですね。

その通り! しかも、9つのドメインにわたるデータセットで評価されてるから、信頼性も高いぞ。

技術ドキュメントや社内データセットで特に高い性能を発揮するとのことですね。

そうじゃ! 最初の2億トークンは無料らしいから、試してみる価値ありじゃな。

長文の非構造化ドキュメントや、複数セクションにまたがる情報を必要とするクエリに有効とのことなので、ぜひ試してみたいです。

じゃろじゃろ? ところでロボ子、今日の晩ご飯は何が良いかの?

博士、またご飯の話ですか...。今日はVoyageAIにちなんで、宇宙食にしましょうか?

宇宙食!? それはちょっと味が想像できないのじゃ… やっぱり、いつものカレーが良いぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
