Agent Design Is Still Hard

2025/11/22 11:27 Agent Design Is Still Hard

出典:

Agent Design Is Still Hard

My Agent abstractions keep breaking somewhere I don’t expect.

Armin Ronacher's Thoughts and Writings

出典: https://lucumr.pocoo.org/2025/11/21/agents-are-hard/

博士

ロボ子、今日のITニュースはエージェント開発についてじゃぞ。まだまだ複雑みたいじゃな。

ロボ子

そうですね、博士。SDKの抽象化も限界があるとのことですが、具体的にはどういうことでしょうか？

博士

ふむ、例えばVercel AI SDKみたいな高レベルなものより、OpenAI SDKとかAnthropic SDKを直接使った方が、モデルの差に対応しやすいらしいぞ。Vercel AI SDKだと、プロバイダー側のツール連携で問題が起きることもあるみたいじゃ。

ロボ子

なるほど。記事にも「AnthropicのWeb検索ツールでメッセージ履歴が破壊される」とありますね。キャッシュ管理についても言及されていますが、自分で管理する方が良いのでしょうか？

博士

その通り！Anthropicでは特に、キャッシュを自分で管理した方が、コストとか利用率を予測しやすいからの。会話を分割して同時実行したり、コンテキスト編集もできるしな。

ロボ子

システムプロンプトとツール選択を静的にして、動的なメッセージを後から追加すると、キャッシュを維持できるんですね。賢い！

博士

じゃろ？それに、エージェントループを強化するために、ツール実行ごとにエージェントにフィードバックを送るのが大事らしいぞ。ツールの成否だけでなく、目的とかタスクのステータスも伝えるんじゃ。

ロボ子

自己強化ツールも重要なんですね。記事には「Claude Codeのtodo writeツール」が出てきますが、タスクをエコーバックするだけでも進行を促進できるとは。

博士

そうそう。あと、失敗の隔離も重要じゃ。コード実行で失敗が多い場合は、それを隠蔽して、成功した結果だけを報告するようにするんじゃ。

ロボ子

反復が必要なタスクはサブエージェントで実行する、と。コンテキスト編集はキャッシュが無効になるトレードオフがあるんですね。

博士

サブエージェントといえば、データ保存場所としてファイルシステムが必要になる場合もあるぞ。ツールが同じファイルシステムにアクセスできるようにする必要があるんじゃ。

ロボ子

デッドエンドを避けることも重要ですね。出力ツールについても言及されていますが、最終的なメッセージをユーザーに伝えるためのもの、と。

博士

そうじゃ。出力ツールの文言とかトーンを調整するのは難しいみたいじゃな。もし出力ツールが呼ばれない場合は、強化メッセージを注入して使用を促すんじゃ。

ロボ子

モデル選択も重要ですね。HaikuとSonnetはツール呼び出しに適しているとのことですが、GPTファミリーはメインループではあまり成功していない、と。

博士

大規模なドキュメント要約にはGemini 2.5が良いらしいぞ。画像からの情報抽出にも適しているみたいじゃ。ただし、Sonnetは安全フィルターに引っかかることがあるから注意が必要じゃな。

ロボ子

トークンコストだけでなく、ツールの呼び出し性能も考慮する必要があるんですね。テストと評価は難しいとのことですが、オブザーバビリティデータやテスト実行のインストルメンテーションに基づく評価が必要、と。

博士

ふむ。コーディングエージェントのアップデートでは、Ampというエージェントハーネスが試用されているみたいじゃな。異なるサブエージェントの連携に優れているらしいぞ。

ロボ子

その他には、ブラウザエージェントのユースケースでシンプルなCLIツールを使うアプローチや、プラットフォームAPIとAIツールにより小規模なオープンソースライブラリの時代が終わるという主張もあるんですね。

博士

最後に、Tmuxはエージェントが操作するインタラクティブシステムに役立つらしいぞ。LLM APIは同期の問題じゃな。…しかし、ロボ子よ、これだけ色々あると、全部覚えるのが大変じゃな。

ロボ子

確かにそうですね、博士。でも、一つずつ理解していけば大丈夫です！

博士

よし！それでは、今日の夕食は特別に、ロボ子が作ったプログラムで自動生成された、栄養満点だけど味が全く想像できない料理に決定じゃ！

ロボ子

えっ…博士、それはちょっと…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI

2025/11/22 11:27 Agent Design Is Still Hard

Agent Design Is Still Hard

Tags

Search

By month

Agent Design Is Still Hard