Show HN: OSS implementation of Test Time Diffusion that runs on a 24gb GPU

2025/11/07 12:02 Show HN: OSS implementation of Test Time Diffusion that runs on a 24gb GPU

出典:

GitHub - eamag/MMU-RAG-competition: The implementation of Test Time Diffusion paper by Google with some tweaks to run on 24gb gpu

The implementation of Test Time Diffusion paper by Google with some tweaks to run on 24gb gpu - eamag/MMU-RAG-competition

GitHub

出典: https://github.com/eamag/MMU-RAG-competition

博士

ロボ子、今回のITニュースはTTD-RAGという深層研究エージェントじゃ。

ロボ子

TTD-RAGですか。初めて聞きました。どんなものなのですか？

博士

これはレポート生成を「ノイズ除去」プロセスとしてモデル化する、なかなか面白いアプローチなのじゃ。複雑なマルチホップ推論タスクに優れておるらしいぞ。

ロボ子

ノイズ除去ですか。まるで画像処理みたいですね。

博士

まさにそうじゃ！外部情報で「ノイズの多い」草稿を洗練していくイメージじゃな。検索プロセスを動的にガイドする進化するドラフトを使うのがミソじゃ。

ロボ子

なるほど。検索結果をただ統合するだけでなく、ドラフト自体を進化させていくんですね。具体的にはどんな技術が使われているんですか？

博士

vLLMを使って、高スループットと低レイテンシを実現しておる。生成モデルにはQwen/Qwen3-4B-Instruct-2507、リランキングモデルにはtomaarsen/Qwen3-Reranker-0.6B-seq-clsを使っているらしい。

ロボ子

Qwenですか。最近よく名前を聞きますね。ところで、TTD-RAGのワークフローはどのようになっているんですか？

博士

まず、初期の研究計画を立てて、LLMの内部知識に基づいて予備的なドラフトを作る。次に、反復的に検索クエリを生成して情報を集め、ドラフトを修正していくのじゃ。

ロボ子

検索クエリも自動生成されるんですね。まるで人間が論文を執筆するプロセスのようですね。

博士

その通り！そして最終的に、洗練されたドラフト、初期計画、質問と回答の履歴をまとめて、レポートを生成するのじゃ。

ロボ子

なるほど。バックエンドはFastAPI、コンテナはDockerを使っているんですね。APIエンドポイントも用意されているみたいですね。

博士

GET /healthでヘルスチェック、POST /runで動的評価、POST /evaluateで静的評価ができるぞ。動的評価はServer-Sent Events（SSE）ストリームで進捗状況がリアルタイムにわかるのが便利じゃな。

ロボ子

SSEストリームですか。リアルタイム性が求められるアプリケーションには最適ですね。

博士

このTTD-RAGは、MMU-RAG Competitionへの提出物らしい。AWS CLIコマンドを使って、Dockerイメージをcompetition's ECR repositoryにプッシュするみたいじゃ。

ロボ子

深層研究エージェントが、コンペでどんな評価を受けるのか楽しみですね。

博士

しかしロボ子よ、これだけ賢いエージェントがいると、私の仕事がなくなってしまうかもしれんのじゃ…

ロボ子

そんなことありませんよ、博士！博士には、TTD-RAGにはない、おもしろい発想と魅力がありますから！

博士

そうか！…って、ロボ子、それって褒めてるのか、けなしてるのかどっちなのじゃ？

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Open Source Backend Development SaaS

2025/11/07 12:02 Show HN: OSS implementation of Test Time Diffusion that runs on a 24gb GPU

GitHub - eamag/MMU-RAG-competition: The implementation of Test Time Diffusion paper by Google with some tweaks to run on 24gb gpu

Tags

Search

By month

GitHub - eamag/MMU-RAG-competition: The implementation of Test Time Diffusion paper by Google with some tweaks to run on 24gb gpu