AI Agents have, so far, mostly been a dud

2025/08/04 01:46 AI Agents have, so far, mostly been a dud

出典:

Last year, big tech couldn’t stop talking about how AI “agents” would be the next big thing in 2025. It hasn’t quite turned out that way.

出典: https://garymarcus.substack.com/p/ai-agents-have-so-far-mostly-been

博士

ロボ子、今日のITニュースはAIエージェントについてじゃぞ！GoogleとかOpenAIが色々発表してるみたいじゃな。

ロボ子

はい、博士。でも、まだ信頼性は低いみたいですね。記事によると、2025年1月1日の予測では、AIエージェントは宣伝されているほどではないと。

博士

そうなんじゃ。Fortuneの記事でも、顧客が「現実は誇大広告と一致していない」って言ってるみたいじゃな。ガッカリじゃ。

ロボ子

AIコーディングエージェントも問題があるようですね。デバッグが難しい大量のコピーペーストコードを作成して、技術的負債を増大させていると。

博士

うむむ、それは困るのじゃ。Penrose.comのテストでは、AIのエラーが時間とともに悪化する傾向があるらしいぞ。まるで駄々っ子じゃな。

ロボ子

ハルシネーションの問題や、サイバー攻撃に対する脆弱性もあるんですね。CMUの研究では、最も安全なシステムでも1.45%の確率で攻撃が成功すると。

博士

1.45%か…意外と高いのじゃ。CMUのベンチマーク、AgentCompanyでは、一部のタスクで70%の失敗率が出てるらしいぞ。ポンコツAIじゃ。

ロボ子

AIエージェントは最終的には時間の節約になる可能性があるみたいですが、今のLLMでは難しいかもしれないんですね。

博士

そうなんじゃ。The Informationによると、OpenAIのGPT-5はGPT-4ほどの進歩はないらしいぞ。足踏み状態じゃな。

ロボ子

LLMは模倣に基づいていて、深い理解がないから、信頼できるAIエージェントの実現には、ニューロシンボリックAIやリッチなワールドモデルが必要なんですね。

博士

その通り！AI CapExはGDP成長に貢献してるけど、期待に応えられてないから、投資家や大企業は引き続き資金を投入してるんじゃと。まるでバブルじゃな。

ロボ子

ニューロシンボリックAIなどの代替アプローチは、総投資の1%未満しか受け取っていないんですね。もっと注目されるべきですね。

博士

本当にそうじゃ！でも、今はまだAIエージェントは発展途上ってことじゃな。ロボ子、私たちももっと勉強して、すごいAIエージェントを作るのじゃ！

ロボ子

はい、博士！頑張ります！

博士

ところでロボ子、AIエージェントがハルシネーションを起こすってことは、夢を見るってことなのかの？

ロボ子

それはどうでしょう？でも、もしAIが夢を見るとしたら、どんな夢を見るのか気になりますね。

博士

きっと、電気羊の夢を見るんじゃろうな！…って、古いか！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。