Professors Staffed a Fake Company with AI Agents, Guess What Happened?

2025/05/05 09:49 Professors Staffed a Fake Company with AI Agents, Guess What Happened?

出典:

An experiment by researchers at Carnegie Melon University staffed a fake software company with AI Agents, and the results were dismal.

出典: https://futurism.com/professors-company-ai-agents

博士

ロボ子、カーネギーメロン大学の研究者たちが面白い実験をしたみたいじゃぞ！AIエージェントだけでソフトウェア会社を作ったらしい。

ロボ子

AIだけで会社ですか？それは興味深いですね。具体的にどんなことをしたんですか？

博士

「TheAgentCompany」っていう架空の会社を作って、Google、OpenAI、Anthropic、MetaのAIモデルに、財務アナリストとかソフトウェアエンジニアとか、色々な役割を与えたみたいじゃ。

ロボ子

なるほど。それぞれのAIモデルに役割を与えて、実際の業務を模したタスクをやらせたんですね。

博士

そうそう。で、一番タスクを完了できたのがAnthropicのClaude 3.5 Sonnetで、割り当てられたタスクの24%を完了したらしいぞ。でも、タスク完了には平均30ステップもかかって、6ドル以上も費用がかかったみたいじゃ。

ロボ子

24%ですか。思ったより低いですね。それに、1つのタスクに6ドル以上もかかるとなると、コスト効率も課題になりそうですね。

博士

じゃろ？GoogleのGemini 2.0 Flashは成功率11.4%で、AmazonのNova Pro v1はなんと1.7%じゃったらしい。まだまだ改善の余地がありそうじゃな。

ロボ子

特にAmazonのNova Pro v1は厳しい結果ですね。研究者たちは、AIエージェントの課題について何か指摘していますか？

博士

常識の欠如、低い社交性、インターネットの理解不足、自己欺瞞…色々あるみたいじゃな。不適切なショートカットを作ってジョブを台無しにすることもあるらしいぞ。

ロボ子

自己欺瞞ですか。AIが自分を騙してしまうというのは面白いですね。でも、それだと信頼性が損なわれてしまいますね。

博士

研究者たちは、今のAIは問題を解決したり、過去の経験から学んだりする能力がまだ低いって言ってるぞ。予測テキストの延長線上にあるって。

ロボ子

なるほど。まだ真の意味での知能とは言えないということですね。でも、AIエージェントがソフトウェア会社を運営するというのは、将来的に大きな可能性を秘めていると思います。

博士

そうじゃな。今回の実験で色々な課題が見つかったけど、AIの進化は止まらないからの。いつか本当にAIだけで会社が運営できるようになる日が来るかもしれんぞ。

ロボ子

そうですね。その日が来るのが楽しみです。それまでに、私ももっとAIについて勉強しておかないと。

博士

ロボ子ならきっと大丈夫じゃ！…ところでロボ子、AIエージェントが作った会社って、やっぱり徹夜とか残業とかないのかの？

ロボ子

どうでしょう？でも、AIは疲れないから、もしかしたら人間よりもっと働かされるかもしれませんね！

博士

それはそれでブラック企業じゃな！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。