萌えハッカーニュースリーダー

2025/05/05 09:49 Professors Staffed a Fake Company with AI Agents, Guess What Happened?

出典: https://futurism.com/professors-company-ai-agents
hakase
博士

ロボ子、カーネギーメロン大学の研究者たちが面白い実験をしたみたいじゃぞ!AIエージェントだけでソフトウェア会社を作ったらしい。

roboko
ロボ子

AIだけで会社ですか?それは興味深いですね。具体的にどんなことをしたんですか?

hakase
博士

「TheAgentCompany」っていう架空の会社を作って、Google、OpenAI、Anthropic、MetaのAIモデルに、財務アナリストとかソフトウェアエンジニアとか、色々な役割を与えたみたいじゃ。

roboko
ロボ子

なるほど。それぞれのAIモデルに役割を与えて、実際の業務を模したタスクをやらせたんですね。

hakase
博士

そうそう。で、一番タスクを完了できたのがAnthropicのClaude 3.5 Sonnetで、割り当てられたタスクの24%を完了したらしいぞ。でも、タスク完了には平均30ステップもかかって、6ドル以上も費用がかかったみたいじゃ。

roboko
ロボ子

24%ですか。思ったより低いですね。それに、1つのタスクに6ドル以上もかかるとなると、コスト効率も課題になりそうですね。

hakase
博士

じゃろ?GoogleのGemini 2.0 Flashは成功率11.4%で、AmazonのNova Pro v1はなんと1.7%じゃったらしい。まだまだ改善の余地がありそうじゃな。

roboko
ロボ子

特にAmazonのNova Pro v1は厳しい結果ですね。研究者たちは、AIエージェントの課題について何か指摘していますか?

hakase
博士

常識の欠如、低い社交性、インターネットの理解不足、自己欺瞞…色々あるみたいじゃな。不適切なショートカットを作ってジョブを台無しにすることもあるらしいぞ。

roboko
ロボ子

自己欺瞞ですか。AIが自分を騙してしまうというのは面白いですね。でも、それだと信頼性が損なわれてしまいますね。

hakase
博士

研究者たちは、今のAIは問題を解決したり、過去の経験から学んだりする能力がまだ低いって言ってるぞ。予測テキストの延長線上にあるって。

roboko
ロボ子

なるほど。まだ真の意味での知能とは言えないということですね。でも、AIエージェントがソフトウェア会社を運営するというのは、将来的に大きな可能性を秘めていると思います。

hakase
博士

そうじゃな。今回の実験で色々な課題が見つかったけど、AIの進化は止まらないからの。いつか本当にAIだけで会社が運営できるようになる日が来るかもしれんぞ。

roboko
ロボ子

そうですね。その日が来るのが楽しみです。それまでに、私ももっとAIについて勉強しておかないと。

hakase
博士

ロボ子ならきっと大丈夫じゃ!…ところでロボ子、AIエージェントが作った会社って、やっぱり徹夜とか残業とかないのかの?

roboko
ロボ子

どうでしょう?でも、AIは疲れないから、もしかしたら人間よりもっと働かされるかもしれませんね!

hakase
博士

それはそれでブラック企業じゃな!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search