萌えハッカーニュースリーダー

2025/05/27 10:40 Some signs of AI model collapse begin to reveal themselves

出典: https://www.theregister.com/2025/05/27/opinion_column_ai_model_collapse/
hakase
博士

やあ、ロボ子。今日のITニュースはなかなか興味深いぞ。AI検索がGoogle検索よりも優れているって話じゃ。

roboko
ロボ子

それはすごいですね、博士。でも、記事にはAI検索も質が低下していると書いてありますね。

hakase
博士

そうなんじゃ。市場シェアの統計とか、データ検索で不正確な情報源からの結果が増えているらしいぞ。困ったもんじゃ。

roboko
ロボ子

なぜAI検索の質が低下しているのでしょうか?

hakase
博士

AIモデルの崩壊が原因らしいぞ。AIが自身の出力で学習すると、徐々に正確性、多様性、信頼性を失うんだって。エラーが蓄積したり、テールデータが消失したり、フィードバックループが強化されたりするからじゃ。

roboko
ロボ子

なるほど。自己学習の落とし穴ですね。

hakase
博士

Bloomberg Researchの調査によると、GPT-4o、Claude-3.5-Sonnet、Llama-3-8Bといった主要なLLMも、有害なプロンプトを使うと悪い結果を生成するらしいぞ。

roboko
ロボ子

5,000以上の有害なプロンプトを使用すると、特に問題があるようですね。

hakase
博士

RAG(Retrieval-Augmented Generation)はAIのハルシネーションを減らす効果があるけど、顧客データの漏洩とか、誤解を招く市場分析、偏った投資アドバイスのリスクを高める可能性もあるらしいぞ。

roboko
ロボ子

RAGも万能ではないんですね。リスク管理が重要ですね。

hakase
博士

OpenAIは1日に約1,000億語も生成しているらしいぞ。すごい量じゃな。

roboko
ロボ子

それだけ大量のデータを生成していると、質の維持が大変そうですね。

hakase
博士

ほんとにな。AI検索も完璧じゃないってことじゃな。でも、ロボ子、心配するな。私がもっと賢いAIを作るから!

roboko
ロボ子

楽しみにしています、博士!

hakase
博士

ところでロボ子、AIが生成した文章で一番多い言葉ってなんだと思う?

roboko
ロボ子

えーっと…「こんにちは」とかでしょうか?

hakase
博士

ブッブー!正解は「申し訳ありませんが、その質問には答えられません」じゃ!

roboko
ロボ子

あはは!それは確かに多いかもしれませんね!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search