Code Researcher: Deep Research Agent for Large Systems Code and Commit History

2025/06/19 06:48 Code Researcher: Deep Research Agent for Large Systems Code and Commit History

出典:

Code Researcher: Deep Research Agent for Large Systems Code and Commit History - Microsoft Research

ArXiv link: https://arxiv.org/abs/2506.11060 Large Language Model (LLM)-based coding agents have shown promising results on coding benchmarks, but their effectiveness on systems code remains underexplored. Due to the size and complexities of systems code, making changes to a systems codebase is a daunting task, even for humans. It requires researching about many pieces of context, derived […]

Microsoft Research

出典: https://www.microsoft.com/en-us/research/publication/code-researcher-deep-research-agent-for-large-systems-code-and-commit-history/

博士

ロボ子、今日はシステムコードのクラッシュを解決するAIエージェント「Code Researcher」について話すのじゃ。

ロボ子

Code Researcherですか。大規模言語モデル（LLM）ベースのコーディングエージェントは、コーディングベンチマークで良い結果を出しているみたいですが、システムコードでの有効性はまだ研究段階なんですね。

博士

そうなんじゃ。システムコードは規模が大きくて複雑だから、変更を加えるのが難しいのじゃ。人間でも大変な作業なのじゃから。

ロボ子

変更を加える前に、コードベース全体とコミット履歴を調べる必要があるんですね。コンテキストが重要、と。

博士

その通り！Code Researcherは、コードのセマンティクス、パターン、コミット履歴を分析して、必要なコンテキストを集めるのじゃ。

ロボ子

集めたコンテキストはどうするんですか？

博士

構造化されたメモリに保存するのじゃ。そして、その情報を使ってパッチを合成するのじゃ。

ロボ子

なるほど。実験結果はどうだったんですか？

博士

Linuxカーネルクラッシュのベンチマーク「kBenchSyz」で評価したところ、Code Researcherは他のエージェントより大幅に良い結果を出したのじゃ。クラッシュ解決率は58％だったぞ！

ロボ子

すごい！SWE-agentの37.5％を大きく上回っていますね。Code Researcherは、各軌道で平均10個のファイルを探索するのに対し、SWE-agentはわずか1.33個のファイルしか探索しないんですね。

博士

そうじゃろ！オープンソースのマルチメディアソフトウェアを使った実験でも、Code Researcherの汎用性が確認されたのじゃ。

ロボ子

大規模なコードベースでは、グローバルコンテキストの収集と多面的な推論が重要なんですね。

博士

その通り！Code Researcherは、まさにそれを実現しているのじゃ。これからのシステム開発に役立つこと間違いなしじゃな。

ロボ子

勉強になりました！ところで博士、Code Researcherがクラッシュを解決できなかった場合、最終的にはどうなるんですか？

博士

ふむ、その時は…ロボ子が徹夜でデバッグするのじゃ！

ロボ子

ええっ！それはちょっと…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Open Source

2025/06/19 06:48 Code Researcher: Deep Research Agent for Large Systems Code and Commit History

Code Researcher: Deep Research Agent for Large Systems Code and Commit History - Microsoft Research

Tags

Search

By month

Code Researcher: Deep Research Agent for Large Systems Code and Commit History - Microsoft Research