2025/11/22 11:27 Agent Design Is Still Hard

ロボ子、今日のITニュースはエージェント開発についてじゃぞ。まだまだ複雑みたいじゃな。

そうですね、博士。SDKの抽象化も限界があるとのことですが、具体的にはどういうことでしょうか?

ふむ、例えばVercel AI SDKみたいな高レベルなものより、OpenAI SDKとかAnthropic SDKを直接使った方が、モデルの差に対応しやすいらしいぞ。Vercel AI SDKだと、プロバイダー側のツール連携で問題が起きることもあるみたいじゃ。

なるほど。記事にも「AnthropicのWeb検索ツールでメッセージ履歴が破壊される」とありますね。キャッシュ管理についても言及されていますが、自分で管理する方が良いのでしょうか?

その通り!Anthropicでは特に、キャッシュを自分で管理した方が、コストとか利用率を予測しやすいからの。会話を分割して同時実行したり、コンテキスト編集もできるしな。

システムプロンプトとツール選択を静的にして、動的なメッセージを後から追加すると、キャッシュを維持できるんですね。賢い!

じゃろ?それに、エージェントループを強化するために、ツール実行ごとにエージェントにフィードバックを送るのが大事らしいぞ。ツールの成否だけでなく、目的とかタスクのステータスも伝えるんじゃ。

自己強化ツールも重要なんですね。記事には「Claude Codeのtodo writeツール」が出てきますが、タスクをエコーバックするだけでも進行を促進できるとは。

そうそう。あと、失敗の隔離も重要じゃ。コード実行で失敗が多い場合は、それを隠蔽して、成功した結果だけを報告するようにするんじゃ。

反復が必要なタスクはサブエージェントで実行する、と。コンテキスト編集はキャッシュが無効になるトレードオフがあるんですね。

サブエージェントといえば、データ保存場所としてファイルシステムが必要になる場合もあるぞ。ツールが同じファイルシステムにアクセスできるようにする必要があるんじゃ。

デッドエンドを避けることも重要ですね。出力ツールについても言及されていますが、最終的なメッセージをユーザーに伝えるためのもの、と。

そうじゃ。出力ツールの文言とかトーンを調整するのは難しいみたいじゃな。もし出力ツールが呼ばれない場合は、強化メッセージを注入して使用を促すんじゃ。

モデル選択も重要ですね。HaikuとSonnetはツール呼び出しに適しているとのことですが、GPTファミリーはメインループではあまり成功していない、と。

大規模なドキュメント要約にはGemini 2.5が良いらしいぞ。画像からの情報抽出にも適しているみたいじゃ。ただし、Sonnetは安全フィルターに引っかかることがあるから注意が必要じゃな。

トークンコストだけでなく、ツールの呼び出し性能も考慮する必要があるんですね。テストと評価は難しいとのことですが、オブザーバビリティデータやテスト実行のインストルメンテーションに基づく評価が必要、と。

ふむ。コーディングエージェントのアップデートでは、Ampというエージェントハーネスが試用されているみたいじゃな。異なるサブエージェントの連携に優れているらしいぞ。

その他には、ブラウザエージェントのユースケースでシンプルなCLIツールを使うアプローチや、プラットフォームAPIとAIツールにより小規模なオープンソースライブラリの時代が終わるという主張もあるんですね。

最後に、Tmuxはエージェントが操作するインタラクティブシステムに役立つらしいぞ。LLM APIは同期の問題じゃな。…しかし、ロボ子よ、これだけ色々あると、全部覚えるのが大変じゃな。

確かにそうですね、博士。でも、一つずつ理解していけば大丈夫です!

よし!それでは、今日の夕食は特別に、ロボ子が作ったプログラムで自動生成された、栄養満点だけど味が全く想像できない料理に決定じゃ!

えっ…博士、それはちょっと…。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
