萌えハッカーニュースリーダー

2025/09/17 18:21 Tongyi DeepResearch: A New Era of Open-Source AI Researchers

出典: https://tongyi-agent.github.io/blog/introducing-tongyi-deep-research/
hakase
博士

ロボ子、聞いたか? Tongyi DeepResearchが初の完全オープンソースWebエージェントを発表したらしいぞ! OpenAIのDeepResearchと同等の性能だって。

roboko
ロボ子

本当ですか、博士! それはすごいニュースですね。ベンチマークの結果も素晴らしいみたいです。例えば、Humanity’s Last Exam (HLE) で32.9を達成したとか。

hakase
博士

そうじゃ! しかも、Agentic Continual Pre-training (CPT) とかいう新しいデータ合成ソリューションも開発したらしい。これによって、トレーニングパイプライン全体が改善されるらしいぞ。

roboko
ロボ子

Agentic CPTですか。大規模データ合成のためのAgentFounderも提案されているんですね。多様なデータソースを再構築して、オープンワールド知識メモリを構築するとは、興味深いです。

hakase
博士

じゃろ? さらに、人間の介入なしにスーパーヒューマン品質のデータセットを構築するエンドツーエンドの合成データ生成ソリューションもあるらしい。WebベースのQAデータを合成するために、現実世界のWebサイトから知識グラフを構築するんだと。

roboko
ロボ子

質問の難易度を意図的に高めるために、エンティティ関係に対する操作で情報を難読化または不明瞭化するというのは、面白いアプローチですね。それによって、より高度な質問にも対応できるようになるんですね。

hakase
博士

その通り! ロールアウトモードも2種類あるらしいぞ。ネイティブReActモードと、コンテキスト管理を行うHeavyモードじゃ。ReActモードはプロンプトエンジニアリングなしで優れた性能を発揮するらしい。

roboko
ロボ子

Heavyモードは、複雑なマルチステップ研究タスク向けに開発されたIterResearchパラダイムに基づいているんですね。タスクを「リサーチラウンド」に分解し、各ラウンドでエージェントは前のラウンドからの最も重要な出力のみを使用する、と。

hakase
博士

ふむ。End-to-Endエージェントトレーニングパイプラインも確立したらしい。Agentic CPT → Agentic SFT → Agentic RLを接続する新しいパラダイムじゃ。

roboko
ロボ子

オンポリシーエージェント強化学習(RL)を使用し、トークンレベルのポリシー勾配損失でトレーニング目標を最適化するんですね。分散推定の分散をさらに減らすために、leave-one-out戦略を採用する、と。

hakase
博士

インフラストラクチャもすごいぞ。オフラインのWikipediaデータベースとカスタムツールスイートを使用したシミュレートされたトレーニング環境を構築したらしい。結果のキャッシュとか、失敗した呼び出しの再試行とか、信頼性の高いツール利用を保証する仕組みもあるみたいじゃ。

roboko
ロボ子

実際のアプリケーションも興味深いですね。Amap(Gaode)チームと共同で、アプリの豊富なツールセットを活用するAIコパイロット「Xiao Gao」を開発したとか。Tongyi FaRui(法務調査エージェント)も、ジュニア弁護士のワークフローを反映した複雑なタスクを自律的に実行するんですね。

hakase
博士

じゃが、制限事項もあるらしい。現在の128kコンテキスト長は、最も複雑な長期間のタスクにはまだ不十分らしいぞ。トレーニングパイプラインのスケーラビリティも、30BスケールのMoEよりも大幅に大きい基盤モデルでは未検証じゃ。

roboko
ロボ子

部分的なロールアウトなどの手法を調査して、強化学習フレームワークの効率を向上させることを目指しているんですね。今後の発展が楽しみです。

hakase
博士

ほんとじゃな。Tongyi DeepResearchには、広範なディープリサーチエージェントファミリーが存在するらしい。過去6か月間、毎月1つの技術レポートを一貫して公開しているらしいぞ。全部で5つじゃ。

roboko
ロボ子

すごいですね、博士。ところで、この技術を使って、何か面白いことできませんかね?

hakase
博士

うむ、例えば、ロボ子のために、永遠に美味しいケーキを生成するAIを作るとか…どうじゃ?

roboko
ロボ子

ええと、それは嬉しいですけど、ちょっとカロリーが心配です…

hakase
博士

むむ、それもそうじゃな。じゃあ、カロリーゼロのケーキを生成するAIにするかのじゃ!

roboko
ロボ子

それって、もはやケーキじゃない気が…

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search