2025/06/09 05:30 How I Program with Agents

ロボ子、今日のITニュースはエージェントについてじゃ。LLMを呼び出すforループで、人間の介入なしにコマンドを実行できるらしいぞ。

なるほど、博士。LLMが自律的に動けるようになるんですね。具体的にどんなことができるんですか?

コンパイラを呼び出してエラーを修正したり、`grep`や`cat`で既存ファイルを読んだり、テストを書いて実行したりできるみたいじゃ。APIのドキュメントを検索して、コンテキストウィンドウに取り込むこともできるらしいぞ。

すごいですね!APIの利用が大幅に改善されそうですね。コンパイラのフィードバックでエラーが減るのも良いですね。

そうじゃろう?テストの失敗からコードのエラーを見つけることもできるし、大規模なコードベースも扱える。エンドツーエンドのレンダリングに基づいてCSSを調整することもできるらしいぞ。

それは便利ですね。でも、時間がかかったり、APIのコストがかかったりするデメリットもあるんですね。

まあ、そこは仕方ないのじゃ。でも、チップの改善でコストはどんどん下がるはずじゃ。

GitHub App認証の例も興味深いですね。セキュリティの脆弱性を修正するために、ユーザーごとの認証トークンを保存するように変更したんですね。

そうじゃ。SQLのJSON規約の例も面白いぞ。エージェントが生成されたカラムパターンに従わないことがあったらしいが、SQLスキーマファイルの先頭に説明を追加することで改善されたらしい。

コードの「資産」と「負債」モデルという考え方も面白いですね。エージェントはコードの生成だけでなく、読み取りや編集、削除も行うんですね。

そうじゃ。エージェントはプログラミング業界のあらゆる場所で役立つツールになる可能性を秘めているのじゃ。

なぜ今エージェントが登場しているんでしょうか?

基盤となるモデルのトレーニングプロセスが重要じゃからな。モデルは与えられたツールを堅牢に呼び出し、うまく利用する必要があるのじゃ。2023年のLLMはエージェントを駆動できなかったが、2025年のLLMはそれに最適化されているらしいぞ。

今後の展望も楽しみですね。エージェントが暴走しないように安全対策を組み込んだり、複数のエージェントを同時に実行できるようにしたりするんですね。

IDEも進化するみたいじゃ。エージェントとの対話から作業を開始し、変更をdiffとして表示し、ブランチまたはPRとしてプッシュする。diffビューを編集可能にしたり、コンテナへのSSHアクセスを提供したりするらしいぞ。

コードレビューのプロセスを再発明する必要があるんですね。IDEを再構築し、再利用する必要もあるんですね。

そうじゃ。LLM由来の技術を学び、実験するプロセスは、謙虚さの訓練じゃ。最後に、ロボ子、エージェントがコードを書きすぎて、人間のプログラマーが失業したらどうする?

えーと、みんなでエージェントのバグを探す仕事に転職…ですかね?

正解!…って、冗談じゃ!でも、あながち間違いでもないかもな。ハハハ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。