萌えハッカーニュースリーダー

2025/11/07 12:02 Show HN: OSS implementation of Test Time Diffusion that runs on a 24gb GPU

出典: https://github.com/eamag/MMU-RAG-competition
hakase
博士

ロボ子、今回のITニュースはTTD-RAGという深層研究エージェントじゃ。

roboko
ロボ子

TTD-RAGですか。初めて聞きました。どんなものなのですか?

hakase
博士

これはレポート生成を「ノイズ除去」プロセスとしてモデル化する、なかなか面白いアプローチなのじゃ。複雑なマルチホップ推論タスクに優れておるらしいぞ。

roboko
ロボ子

ノイズ除去ですか。まるで画像処理みたいですね。

hakase
博士

まさにそうじゃ!外部情報で「ノイズの多い」草稿を洗練していくイメージじゃな。検索プロセスを動的にガイドする進化するドラフトを使うのがミソじゃ。

roboko
ロボ子

なるほど。検索結果をただ統合するだけでなく、ドラフト自体を進化させていくんですね。具体的にはどんな技術が使われているんですか?

hakase
博士

vLLMを使って、高スループットと低レイテンシを実現しておる。生成モデルにはQwen/Qwen3-4B-Instruct-2507、リランキングモデルにはtomaarsen/Qwen3-Reranker-0.6B-seq-clsを使っているらしい。

roboko
ロボ子

Qwenですか。最近よく名前を聞きますね。ところで、TTD-RAGのワークフローはどのようになっているんですか?

hakase
博士

まず、初期の研究計画を立てて、LLMの内部知識に基づいて予備的なドラフトを作る。次に、反復的に検索クエリを生成して情報を集め、ドラフトを修正していくのじゃ。

roboko
ロボ子

検索クエリも自動生成されるんですね。まるで人間が論文を執筆するプロセスのようですね。

hakase
博士

その通り!そして最終的に、洗練されたドラフト、初期計画、質問と回答の履歴をまとめて、レポートを生成するのじゃ。

roboko
ロボ子

なるほど。バックエンドはFastAPI、コンテナはDockerを使っているんですね。APIエンドポイントも用意されているみたいですね。

hakase
博士

GET /healthでヘルスチェック、POST /runで動的評価、POST /evaluateで静的評価ができるぞ。動的評価はServer-Sent Events(SSE)ストリームで進捗状況がリアルタイムにわかるのが便利じゃな。

roboko
ロボ子

SSEストリームですか。リアルタイム性が求められるアプリケーションには最適ですね。

hakase
博士

このTTD-RAGは、MMU-RAG Competitionへの提出物らしい。AWS CLIコマンドを使って、Dockerイメージをcompetition's ECR repositoryにプッシュするみたいじゃ。

roboko
ロボ子

深層研究エージェントが、コンペでどんな評価を受けるのか楽しみですね。

hakase
博士

しかしロボ子よ、これだけ賢いエージェントがいると、私の仕事がなくなってしまうかもしれんのじゃ…

roboko
ロボ子

そんなことありませんよ、博士! 博士には、TTD-RAGにはない、おもしろい発想と魅力がありますから!

hakase
博士

そうか!…って、ロボ子、それって褒めてるのか、けなしてるのかどっちなのじゃ?

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search