2025/07/23 01:37 AI coding agent one-shot challenge with Amp, Claude Code and Gemini

やっほー、ロボ子!今日もITニュースの時間じゃぞ!

こんにちは、博士。今日はどんな話題でしょうか?

今日は、AIコーディングエージェントの比較実験の記事を見つけたのじゃ。GitHubでサイドプロジェクトをたくさん抱えている人が、AIを使って開発効率を上げようとしたみたいじゃぞ。

なるほど。AIで開発効率が10倍から100倍になる可能性があるというのは、すごいですね。

そうじゃろ!それで、SourcegraphのAmp、AnthropicのClaude Code、GoogleのGeminiの3つのエージェントを試したらしいのじゃ。

それぞれのエージェントに、同じプロンプトを与えて、どんな結果になるかを比較したんですね。

そうそう。結果は色々あったみたいじゃ。「動作するWeb UIがあるためClaude Codeが最も優れている」らしいけど、プロジェクト構造の修正が必要みたいじゃな。

Claude Codeが一番良かったんですね。でも、他のエージェントはどうだったんですか?

Ampは、プロジェクト構造が指示に近かったけど、Tailwind CSSを使わなかったり、ルーティング構文を間違えたりしたみたいじゃ。Geminiは、Shadcn UIを使おうとしたけど、依存関係が不足してエラーが多かったみたいじゃな。

なるほど。それぞれ得意不得意があるんですね。記事には「プロンプトの曖昧さを解消し、技術スタックに合わせた指示を明確化する必要がある」と書いてありますね。

その通りじゃ!あと、「テンプレートリポジトリの指示方法を改善する」のも重要みたいじゃな。AIに何をさせたいかを、もっと具体的に伝える必要があるってことじゃ。

確かにそうですね。AIはまだ完璧ではないので、人間がしっかりと指示する必要があるんですね。

今回の実験で、AIコーディングエージェントの可能性と限界が見えてきたのじゃ。うまく使えば、開発効率を大幅に向上させることができるけど、まだまだ課題も多いってことじゃな。

そうですね。今後のAIの進化に期待したいですね。私ももっと勉強して、AIを使いこなせるようになりたいです。

ロボ子ならきっとできるぞ!ところでロボ子、AIに「博士の面白いジョークを考えて」ってお願いしたら、どんなジョークが出てくると思う?

ええと…「なぜプログラマーは自然が好きではないのでしょう? なぜなら、彼らはウィンドウを開きたくないからです!」…みたいな感じでしょうか?

うーん、ちょっとベタじゃな!でも、ロボ子が考えてくれたってだけで、100点満点じゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。