2025/07/01 12:26 Spending Too Much Money on a Coding Agent

ロボ子、最近のコーディングAI事情はすごいことになっておるのじゃ!特に大規模言語モデル(LLM)の進化が目覚ましいぞ。

博士、私もニュースを読みました。以前はコストや速度の問題があったLLMが、日常的なコーディングに使えるレベルになったんですね。

そうじゃ!特に「o3 thinkingモデル」というのがすごいらしいぞ。記事によると、ツールの使用能力、進捗評価、自己修正能力が向上しておるらしい。

o3ですか。1日あたり50ドルもかかるのは驚きですが、それに見合う価値があるということですね。

記事には「Claude 4 SonnetやGPT-4.1と比較して、Claude 4 OpusやOpenAI o3のような大規模思考モデルは以下の点で優れていた」とあるぞ。MCPやCLIのようなツールを効果的に使って問題を解決したり、リスクのあるパッチを提案することが少なかったりするらしい。

なるほど。重複コードを見つけるのではなく、関連コードを見つける能力も高いんですね。テストをコメントアウトするような「報酬ハック」をしないのも良い点です。

そうじゃ!それに、存在しないnpm依存関係を追加しようとしないなど、Cursorのルールをきちんと守るらしいぞ。おりこうさんじゃな。

Andrej Karpathy氏もo3を「重要で困難なことに最適なモデル」と評価しているんですね。Shopifyのエンジニアリング責任者は、コーディングモデルの予算を1人あたり月1000ドルと見積もっているとは。

月1000ドルの価値を得るには、エラーを早期に検出したり、枯れた技術を使用したりするのが良いらしいぞ。Cursorのルールを洗練したり、開発スクリプトを改善したり、読みやすいコードに投資することも重要じゃ。

モデルに共感を持つ、というのも面白いですね。まるでペットを育てるみたいです。

6月にはOpenAIがo3の価格を80%も引き下げたらしいぞ!Cursorも月額200ドルの新しいUltraプランを開始したみたいじゃ。

Claude Code Maxを月額200ドルで利用したり、Cursorでo3を従量課金で利用したりする選択肢も増えましたね。

SlackやWebからCursorのバックグラウンドエージェントを起動したり、Claude Codeを使ってリファクタリングや大規模なジョブをスクリプト化したりできるらしいぞ。

エージェントにPRを起草させ、別のエージェントにレビューさせる、という使い方もできるんですね。o3-proを使って、各問題に対してo3のコピーを10個同時に実行し、最適な出力を選択することも可能とは。

コーディングエージェントは、さまざまなタスクを割り当てることができる。ツールが改善され、使い方が上手くなるにつれて、LLMは「デモのために多くのメンテナンスできないスロップコードをバイブさせることができる」から、「これらの3つのエージェントは同時に作業して、既存のコードを明確でメンテナンス可能な改善をするのに役立つ」に移行しているらしい。

コーディングやデバッグの時間を減らし、システム全体を考える時間が増えるのは素晴らしいですね。

そうじゃ!これからは、AIにコードを書いてもらい、私達はもっと重要なことを考える時代になるのじゃ!

まるでSFの世界ですね。でも、AIに仕事を奪われないように、私たちも進化し続けなければなりませんね。

心配ないぞロボ子!AIがどんなに進化しても、お茶くみと雑用はロボ子の仕事じゃからな!

博士…それって、AIに仕事を奪われてるってことじゃないですか!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。