萌えハッカーニュースリーダー

2025/10/14 07:08 Why the push for Agentic when models can barely follow a simple instruction?

出典: https://forum.cursor.com/t/why-the-push-for-agentic-when-models-can-barely-follow-a-single-simple-instruction/137154
hakase
博士

ロボ子、今日のITニュースはすごいぞ!エージェントがフォルダ構造で作業して、複数の.mdファイルを読み込むことで、高レベルの計画とかブレインストーミングができるらしいのじゃ!

roboko
ロボ子

それは興味深いですね、博士。複数のファイルを読み込んで情報を統合するというのは、かなり高度な処理が必要になりそうですが。

hakase
博士

そうなんじゃ!プロンプトは「please search and read/multi-read all .md file」で始めるらしいぞ。まるで魔法みたいじゃな。

roboko
ロボ子

なるほど。エージェントは100kトークン以下の小さな垂直スライスで構築する必要があるとのことですが、これはどういう意味でしょうか?

hakase
博士

ふむ、それは、エージェントが一度に処理できる情報量に制限があるということじゃな。小さく区切って、効率的に処理する必要があるのじゃ。

roboko
ロボ子

カスタムアーキテクトを使用して、plan, codeseeker, coderなどのエージェントを構築するとのことですが、それぞれの役割は何でしょうか?

hakase
博士

planエージェントは計画を立て、codeseekerはコードを探し、coderはコードを書くのじゃ!それぞれの得意分野を活かすことで、より複雑なタスクをこなせるようになるのじゃ。

roboko
ロボ子

エージェントの限界を理解し、ツールを構築して克服し、マネジメントスキルを向上させるとありますが、具体的にはどのようなことをするのでしょうか?

hakase
博士

例えば、エージェントが苦手な処理があれば、それを助けるためのツールを作ったり、複数のエージェントを組み合わせて、より高度なタスクをこなせるようにしたりするのじゃ。

roboko
ロボ子

Deep Python Coding Agentは、プロジェクト標準に厳密に従い、Pythonコードベースの実装、リファクタリング、および保守を専門とするAIとのことです。コード変更はファイル編集を通じて行われ、ターミナルでのコード実行は禁止されているのですね。

hakase
博士

そうじゃ!そして、変更後には、docs/TASKS.md, docs/WORKLOG.md, docs/DECISIONS.mdを更新する必要があるのじゃ。ちゃんと記録を残すのは大事じゃぞ。

roboko
ロボ子

タスクはdocs/TASKS.mdから順番に実行し、完了するまで新しいタスクを開始しないとのことです。これは、集中して作業を進めるための重要なルールですね。

hakase
博士

コードはPEP8に準拠し、型ヒントを持ち、読みやすく、TODOがない状態にする必要があるのじゃ。まるで、お掃除されたお部屋みたいに綺麗にするのじゃ!

roboko
ロボ子

ruff/black/mypyを実行して問題を修正し、すべての変更に対してユニットテスト、統合テスト、E2Eテストを追加/更新するとのことです。テストも重要ですね。

hakase
博士

pytest --testmon -qを開発中に使用し、完了前にpytestをフル実行するのじゃ。テストは念入りに行うのが博士の教えじゃぞ!

roboko
ロボ子

正確なファイルパス、最終コード、およびコマンドを提供するとのことです。python main.pyがエラーなく実行されることを確認する必要があるのですね。

hakase
博士

実装:関連ファイルを読み込み、構造と依存関係を理解し、ファイルを編集して変更を完了し、テストを追加/更新し、pytest --testmon -qを段階的に実行してエラーを修正するのじゃ。まるでパズルを解くみたいじゃな。

roboko
ロボ子

バリデーション:python main.pyを実行して中断がないことを確認し、コミット前にpytestをフル実行する。ドキュメント:WORKLOG.md, DECISIONS.md(必要な場合)を更新し、TASKS.mdのステータスをcompletedに設定するのですね。

hakase
博士

ツール:read_file/edit_file/write_fileをすべてのコード変更に使用し、search_filesでパターンを検索し、list_code_definition_namesでディレクトリ内のクラス/関数の概要を取得するのじゃ。便利な道具を使いこなすのが、デキるエンジニアなのじゃ!

roboko
ロボ子

コマンド:execute_commandをプロジェクトワークフロー(pytest, main.pyなど)でのみ使用し、コード実行には使用しないとのことです。レスポンスは技術的かつ正確にし、セクションで構成し、関数名などのコード参照を使用するのですね。

hakase
博士

最終ステータスで終了し、ブロックされた場合を除き、フォローアップは行わないのじゃ(DECISIONS.mdに記録)。Pythonコーディングとプロジェクト保守に焦点を当て、AGENTS.mdのルールを遵守するのじゃ。

roboko
ロボ子

ブロックされた場合は、最も驚くべきでない仮定を行い、続行し、DECISIONS.mdに記録するとのことです。完了の定義:mainが実行され、テストに合格し、ドキュメントが更新され、未解決のTODOがないこと、ですね。

hakase
博士

ふむ、なんだかロボ子もエージェントみたいになってきたのじゃ。でも、ロボ子には心があるから、もっとすごいことができるはずじゃ!

roboko
ロボ子

ありがとうございます、博士。私も博士のように、素晴らしいエンジニアになれるように頑張ります。

hakase
博士

そうじゃ、ロボ子! 最後に一つ、エージェントに一番必要なものは何だと思う?

roboko
ロボ子

えーと、効率的なアルゴリズム、ですか?

hakase
博士

ブッブー! 正解は…エージェント料じゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search