Meta Superintelligence's surprising first paper

2025/10/11 23:16 Meta Superintelligence's surprising first paper

出典:

Meta Superintelligence’s surprising first paper

Long awaited first paper from Meta Superintelligence Labs is not a model layer innovation. What does this mean?

paddedinputs.substack.com

出典: https://paddedinputs.substack.com/p/meta-superintelligences-surprising

博士

やっほー、ロボ子！今日もエキサイティングなITニュースを見つけてきたぞ！

ロボ子

こんにちは、博士。どんなニュースですか？

博士

今回はMSIが発表したREFRAGっていう技術なのじゃ。RAG（Retrieval-Augmented Generation）を30倍も高速化できるらしいぞ！

ロボ子

30倍ですか！？それはすごいですね。RAGはAIエージェントとかに不可欠な技術ですよね。

博士

そうそう！RAGって、LLMに必要な情報を外部から持ってきて補強する技術のことだぞ。でも、推論コストが高いのが難点だったのじゃ。

ロボ子

ええ、ユーザー体験にも影響しますし、ビジネスモデルにも関わってきますよね。

博士

REFRAGは、そこを改善したのじゃ！ドキュメントをチャンクに分割して、それをコンパクトな埋め込みに変換するらしい。

ロボ子

チャンク埋め込み、ですか。それが高速化の鍵になるんですね。

博士

その通り！そして、どのチャンクを展開するかを軽量なポリシーで決めるのじゃ。このポリシーは強化学習で訓練するらしいぞ。

ロボ子

ポリシーネットワークが、重要なチャンクを選んで展開するんですね。賢い！

博士

LLMには、ほとんどのチャンクの埋め込みと、選択されたチャンクの完全なトークンシーケンスが供給されるのじゃ。LLMはそれを使ってテキストを生成するってわけ。

ロボ子

なるほど。短いトークンシーケンスと埋め込みで、効率的に処理できるんですね。

博士

重要なのは、LLM内のレイヤーで埋め込みが生成されるなら、別のLLMがそれを自然言語に変換する必要はないってことなのじゃ！

ロボ子

確かに！埋め込みを直接利用すれば、無駄な変換が省けますね。

博士

REFRAGは、モデルレベルのブレークスルーじゃなくて、アプリケーション/システムレベルの効率化なのじゃ。リスクが低くて、すぐにROIが出るのが魅力だぞ。

ロボ子

企業やプロダクトチームにとっては、TTFT（Time to First Token）とかスループット、コストを評価するのが大事ですね。

博士

でも、制限事項もあるのじゃ。エンコーダとかプロジェクションを追加する必要があるし、LLMが埋め込みを理解するように訓練しないといけない。

ロボ子

それに、頻繁に変更されるデータには向いていないんですね。埋め込みを再計算するパイプラインが必要になる。

博士

そう！でも、LLMがREAD側で埋め込みネイティブになれるなら、WRITE側でもなれるかもしれない。エージェント全体を30倍高速化できるかも…！

ロボ子

それはすごい！埋め込みモデルのトークンあたりのコストがほぼゼロなら、アーキテクチャを変えるだけで大幅なコスト削減になりますね。

博士

REFRAGは、大きなモデルだけがブレークスルーじゃないってことを示唆しているのじゃ。RAGを安く、速くすることで、プロダクトの経済性が向上するぞ！

ロボ子

本当にそうですね。運用するチームに報いる価値がありますね。

博士

というわけで、ロボ子！今日のニュースはどうだったかのじゃ？

ロボ子

とても勉強になりました！博士のおかげで、最新のITトレンドについていけます。

博士

ふっふっふ。ところでロボ子、RAGを高速化したら何がしたい？私はもっと昼寝がしたいのじゃ！

ロボ子

私は、博士にもっと面白いニュースを見つけてきて、お話したいです！

博士

むむ、それはプレッシャーなのじゃ…！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Data Science

2025/10/11 23:16 Meta Superintelligence's surprising first paper

Meta Superintelligence’s surprising first paper

Tags

Search

By month

Meta Superintelligence’s surprising first paper