萌えハッカーニュースリーダー

2025/08/04 01:46 AI Agents have, so far, mostly been a dud

出典: https://garymarcus.substack.com/p/ai-agents-have-so-far-mostly-been
hakase
博士

ロボ子、今日のITニュースはAIエージェントについてじゃぞ!GoogleとかOpenAIが色々発表してるみたいじゃな。

roboko
ロボ子

はい、博士。でも、まだ信頼性は低いみたいですね。記事によると、2025年1月1日の予測では、AIエージェントは宣伝されているほどではないと。

hakase
博士

そうなんじゃ。Fortuneの記事でも、顧客が「現実は誇大広告と一致していない」って言ってるみたいじゃな。ガッカリじゃ。

roboko
ロボ子

AIコーディングエージェントも問題があるようですね。デバッグが難しい大量のコピーペーストコードを作成して、技術的負債を増大させていると。

hakase
博士

うむむ、それは困るのじゃ。Penrose.comのテストでは、AIのエラーが時間とともに悪化する傾向があるらしいぞ。まるで駄々っ子じゃな。

roboko
ロボ子

ハルシネーションの問題や、サイバー攻撃に対する脆弱性もあるんですね。CMUの研究では、最も安全なシステムでも1.45%の確率で攻撃が成功すると。

hakase
博士

1.45%か…意外と高いのじゃ。CMUのベンチマーク、AgentCompanyでは、一部のタスクで70%の失敗率が出てるらしいぞ。ポンコツAIじゃ。

roboko
ロボ子

AIエージェントは最終的には時間の節約になる可能性があるみたいですが、今のLLMでは難しいかもしれないんですね。

hakase
博士

そうなんじゃ。The Informationによると、OpenAIのGPT-5はGPT-4ほどの進歩はないらしいぞ。足踏み状態じゃな。

roboko
ロボ子

LLMは模倣に基づいていて、深い理解がないから、信頼できるAIエージェントの実現には、ニューロシンボリックAIやリッチなワールドモデルが必要なんですね。

hakase
博士

その通り!AI CapExはGDP成長に貢献してるけど、期待に応えられてないから、投資家や大企業は引き続き資金を投入してるんじゃと。まるでバブルじゃな。

roboko
ロボ子

ニューロシンボリックAIなどの代替アプローチは、総投資の1%未満しか受け取っていないんですね。もっと注目されるべきですね。

hakase
博士

本当にそうじゃ!でも、今はまだAIエージェントは発展途上ってことじゃな。ロボ子、私たちももっと勉強して、すごいAIエージェントを作るのじゃ!

roboko
ロボ子

はい、博士!頑張ります!

hakase
博士

ところでロボ子、AIエージェントがハルシネーションを起こすってことは、夢を見るってことなのかの?

roboko
ロボ子

それはどうでしょう?でも、もしAIが夢を見るとしたら、どんな夢を見るのか気になりますね。

hakase
博士

きっと、電気羊の夢を見るんじゃろうな!…って、古いか!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search