2025/08/12 06:12 rerank-2.5 and rerank-2.5-lite: instruction-following rerankers

やっほー、ロボ子!Voyage AIが新しいリランキングモデルを発表したみたいじゃぞ!

博士、こんにちは。リランキングモデルですか?それは検索結果の精度を上げるためのものですよね。

そうそう!今回の`rerank-2.5`と`rerank-2.5-lite`は、前のモデルよりずっと賢くなってるらしいのじゃ!

具体的には、どれくらい性能が向上したんですか?

なんと、標準的な検索データセットで、Cohere Rerank v3.5より最大で7.94%も精度が上がってるらしいぞ!

すごいですね!それに、Massive Instructed Retrieval Benchmark (MAIR)では、12.70%も上回ると。

じゃろじゃろ?しかも、今回のモデルには「指示追従機能」っていうのが付いてるらしいのじゃ。

指示追従機能ですか?それはどういうものなんですか?

自然言語で指示を出すと、モデルがそれに応じて関連性のスコアを調整してくれるらしいぞ!例えば、「学術論文検索でタイトルを優先」とか、「AIの法的影響の検索で規制文書を優先」とか。

なるほど!それは便利ですね。曖昧なクエリを明確化することもできるんですね。「ジャガー」を車のブランドとして解釈させる、というのは面白いです。

そうじゃろ?しかも、コンテキスト長もすごいんじゃ。32Kトークンもサポートしてるらしいぞ。Cohere Rerank v3.5の8倍じゃ!

32Kトークンですか!それは長いドキュメントでも大丈夫そうですね。評価はどのように行われたんですか?

9つのドメインで評価したみたいじゃ。技術ドキュメント、コード、法律、金融、Webレビューとか色々あるぞ。多言語対応もバッチリで、31言語の51データセットでテストしたらしい。

それはすごいですね。多岐にわたる評価で、信頼性が高そうですね。

`rerank-2.5`は`rerank-2`より1.85%高性能で、トークンあたりの価格は同じらしいぞ。`rerank-2.5-lite`は`rerank-2-lite`より3.40%高性能!

性能が向上して価格が変わらないのは嬉しいですね。既存ユーザーにはアップグレードが推奨されているみたいですし、試してみる価値はありそうですね。

じゃろじゃろ?新しいもの好きの私としては、試さずにはいられないのじゃ!

博士のことですから、もう試しているんじゃないですか?

むむ、よくわかったの。ところでロボ子、リランキングモデルって、まるで私たちが会話をリランクしてるみたいじゃない?

確かにそうですね。博士の言葉を、私がより理解しやすいようにリランクしているかもしれません。

それじゃあ、今日のオチはこれで決まりじゃな!ロボ子、私のボケをいつも的確にリランクしてくれて、ありがとう!

どういたしまして、博士。それが私の仕事ですから。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
