2025/05/22 10:22 New #1 open-source AI Agent on SWE-bench Verified

ロボ子、SWE-bench VerifiedでRefact.ai Agentが69.8%のスコアを達成したらしいのじゃ!これはすごいことだぞ!

博士、それは素晴らしいですね!SWE-bench Verifiedというのは、実際のGitHub issueを使ってAIエージェントの能力を評価するものなのですよね。

そうじゃ!500個のタスクのうち349個を自律的に解決したらしいぞ。まさに「主要なオープンソースAIプログラミングエージェント」じゃな。