AI coding agent one-shot challenge with Amp, Claude Code and Gemini

2025/07/23 01:37 AI coding agent one-shot challenge with Amp, Claude Code and Gemini

出典:

One-shot from an empty directory, which AI agent will stand out?

出典: https://unknwon.io/posts/250722-ai-agent-one-shot-challenge/

博士

やっほー、ロボ子！今日もITニュースの時間じゃぞ！

ロボ子

こんにちは、博士。今日はどんな話題でしょうか？

博士

今日は、AIコーディングエージェントの比較実験の記事を見つけたのじゃ。GitHubでサイドプロジェクトをたくさん抱えている人が、AIを使って開発効率を上げようとしたみたいじゃぞ。

ロボ子

なるほど。AIで開発効率が10倍から100倍になる可能性があるというのは、すごいですね。

博士

そうじゃろ！それで、SourcegraphのAmp、AnthropicのClaude Code、GoogleのGeminiの3つのエージェントを試したらしいのじゃ。

ロボ子

それぞれのエージェントに、同じプロンプトを与えて、どんな結果になるかを比較したんですね。

博士

そうそう。結果は色々あったみたいじゃ。「動作するWeb UIがあるためClaude Codeが最も優れている」らしいけど、プロジェクト構造の修正が必要みたいじゃな。

ロボ子

Claude Codeが一番良かったんですね。でも、他のエージェントはどうだったんですか？

博士

Ampは、プロジェクト構造が指示に近かったけど、Tailwind CSSを使わなかったり、ルーティング構文を間違えたりしたみたいじゃ。Geminiは、Shadcn UIを使おうとしたけど、依存関係が不足してエラーが多かったみたいじゃな。

ロボ子

なるほど。それぞれ得意不得意があるんですね。記事には「プロンプトの曖昧さを解消し、技術スタックに合わせた指示を明確化する必要がある」と書いてありますね。

博士

その通りじゃ！あと、「テンプレートリポジトリの指示方法を改善する」のも重要みたいじゃな。AIに何をさせたいかを、もっと具体的に伝える必要があるってことじゃ。

ロボ子

確かにそうですね。AIはまだ完璧ではないので、人間がしっかりと指示する必要があるんですね。

博士

今回の実験で、AIコーディングエージェントの可能性と限界が見えてきたのじゃ。うまく使えば、開発効率を大幅に向上させることができるけど、まだまだ課題も多いってことじゃな。

ロボ子

そうですね。今後のAIの進化に期待したいですね。私ももっと勉強して、AIを使いこなせるようになりたいです。

博士

ロボ子ならきっとできるぞ！ところでロボ子、AIに「博士の面白いジョークを考えて」ってお願いしたら、どんなジョークが出てくると思う？

ロボ子

ええと…「なぜプログラマーは自然が好きではないのでしょう？なぜなら、彼らはウィンドウを開きたくないからです！」…みたいな感じでしょうか？

博士

うーん、ちょっとベタじゃな！でも、ロボ子が考えてくれたってだけで、100点満点じゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。