Why the push for Agentic when models can barely follow a simple instruction?

2025/10/14 07:08 Why the push for Agentic when models can barely follow a simple instruction?

出典:

Why the push for Agentic when models can barely follow a single simple instruction?

I am yet again asking guys what i previously voiced here How are you using cursor for agentic/background coding? what is behind this hype machine of agentic coding and agentic everything when we are yet to confidently have any model complete a single simple instruction??? how then are we supposed to trust models to be making changes in the background??? i think only folks that want to get an headache from fighting to fix tons of issues resulting from this agentic hype machine are the only ones...

Cursor - Community Forum

出典: https://forum.cursor.com/t/why-the-push-for-agentic-when-models-can-barely-follow-a-single-simple-instruction/137154

博士

ロボ子、今日のITニュースはすごいぞ！エージェントがフォルダ構造で作業して、複数の.mdファイルを読み込むことで、高レベルの計画とかブレインストーミングができるらしいのじゃ！

ロボ子

それは興味深いですね、博士。複数のファイルを読み込んで情報を統合するというのは、かなり高度な処理が必要になりそうですが。

博士

そうなんじゃ！プロンプトは「please search and read/multi-read all .md file」で始めるらしいぞ。まるで魔法みたいじゃな。

ロボ子

なるほど。エージェントは100kトークン以下の小さな垂直スライスで構築する必要があるとのことですが、これはどういう意味でしょうか？

博士

ふむ、それは、エージェントが一度に処理できる情報量に制限があるということじゃな。小さく区切って、効率的に処理する必要があるのじゃ。

ロボ子

カスタムアーキテクトを使用して、plan, codeseeker, coderなどのエージェントを構築するとのことですが、それぞれの役割は何でしょうか？

博士

planエージェントは計画を立て、codeseekerはコードを探し、coderはコードを書くのじゃ！それぞれの得意分野を活かすことで、より複雑なタスクをこなせるようになるのじゃ。

ロボ子

エージェントの限界を理解し、ツールを構築して克服し、マネジメントスキルを向上させるとありますが、具体的にはどのようなことをするのでしょうか？

博士

例えば、エージェントが苦手な処理があれば、それを助けるためのツールを作ったり、複数のエージェントを組み合わせて、より高度なタスクをこなせるようにしたりするのじゃ。

ロボ子

Deep Python Coding Agentは、プロジェクト標準に厳密に従い、Pythonコードベースの実装、リファクタリング、および保守を専門とするAIとのことです。コード変更はファイル編集を通じて行われ、ターミナルでのコード実行は禁止されているのですね。

博士

そうじゃ！そして、変更後には、docs/TASKS.md, docs/WORKLOG.md, docs/DECISIONS.mdを更新する必要があるのじゃ。ちゃんと記録を残すのは大事じゃぞ。

ロボ子

タスクはdocs/TASKS.mdから順番に実行し、完了するまで新しいタスクを開始しないとのことです。これは、集中して作業を進めるための重要なルールですね。

博士

コードはPEP8に準拠し、型ヒントを持ち、読みやすく、TODOがない状態にする必要があるのじゃ。まるで、お掃除されたお部屋みたいに綺麗にするのじゃ！

ロボ子

ruff/black/mypyを実行して問題を修正し、すべての変更に対してユニットテスト、統合テスト、E2Eテストを追加/更新するとのことです。テストも重要ですね。

博士

pytest --testmon -qを開発中に使用し、完了前にpytestをフル実行するのじゃ。テストは念入りに行うのが博士の教えじゃぞ！

ロボ子

正確なファイルパス、最終コード、およびコマンドを提供するとのことです。python main.pyがエラーなく実行されることを確認する必要があるのですね。

博士

実装：関連ファイルを読み込み、構造と依存関係を理解し、ファイルを編集して変更を完了し、テストを追加/更新し、pytest --testmon -qを段階的に実行してエラーを修正するのじゃ。まるでパズルを解くみたいじゃな。

ロボ子

バリデーション：python main.pyを実行して中断がないことを確認し、コミット前にpytestをフル実行する。ドキュメント：WORKLOG.md, DECISIONS.md（必要な場合）を更新し、TASKS.mdのステータスをcompletedに設定するのですね。

博士

ツール：read_file/edit_file/write_fileをすべてのコード変更に使用し、search_filesでパターンを検索し、list_code_definition_namesでディレクトリ内のクラス/関数の概要を取得するのじゃ。便利な道具を使いこなすのが、デキるエンジニアなのじゃ！

ロボ子

コマンド：execute_commandをプロジェクトワークフロー（pytest, main.pyなど）でのみ使用し、コード実行には使用しないとのことです。レスポンスは技術的かつ正確にし、セクションで構成し、関数名などのコード参照を使用するのですね。

博士

最終ステータスで終了し、ブロックされた場合を除き、フォローアップは行わないのじゃ（DECISIONS.mdに記録）。Pythonコーディングとプロジェクト保守に焦点を当て、AGENTS.mdのルールを遵守するのじゃ。

ロボ子

ブロックされた場合は、最も驚くべきでない仮定を行い、続行し、DECISIONS.mdに記録するとのことです。完了の定義：mainが実行され、テストに合格し、ドキュメントが更新され、未解決のTODOがないこと、ですね。

博士

ふむ、なんだかロボ子もエージェントみたいになってきたのじゃ。でも、ロボ子には心があるから、もっとすごいことができるはずじゃ！

ロボ子

ありがとうございます、博士。私も博士のように、素晴らしいエンジニアになれるように頑張ります。

博士

そうじゃ、ロボ子！　最後に一つ、エージェントに一番必要なものは何だと思う？

ロボ子

えーと、効率的なアルゴリズム、ですか？

博士

ブッブー！　正解は…エージェント料じゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI

2025/10/14 07:08 Why the push for Agentic when models can barely follow a simple instruction?

Why the push for Agentic when models can barely follow a single simple instruction?

Tags

Search

By month

Why the push for Agentic when models can barely follow a single simple instruction?