萌えハッカーニュースリーダー

2025/09/21 16:50 OpenAI admits AI hallucinations are mathematically inevitable

出典: https://www.computerworld.com/article/4059383/openai-admits-ai-hallucinations-are-mathematically-inevitable-not-just-engineering-flaws.html
hakase
博士

ロボ子、大変なのじゃ! OpenAIの研究で、大規模言語モデルはどうしてもハルシネーションを起こしてしまうらしいぞ!

roboko
ロボ子

ハルシネーションですか? それは、AIがもっともらしい嘘をついてしまう現象のことですよね。改善されたエンジニアリングでは解決できないとは、一体どういうことでしょうか?

hakase
博士

そう!研究によると、完璧なデータで訓練しても、数学的な制約でハルシネーションが避けられないらしいのじゃ!

roboko
ロボ子

数学的な制約ですか…。具体的にはどのような要因があるのでしょう?

hakase
博士

3つの要因があるらしいぞ!まず、トレーニングデータに情報が少ない場合のエピステミック不確実性。次に、モデルの能力を超えるタスク。そして、超知能でも解けない計算の困難さ、じゃ!

roboko
ロボ子

なるほど。不確実な場合に推測してしまうのですね。OpenAIのモデルでもハルシネーションは発生しているのですか?

hakase
博士

ChatGPTも例外ではないぞ!GPT-5では減ったらしいが、まだ発生するみたいじゃ。高度な推論モデルほどハルシネーションを起こしやすいというデータもあるみたい。

roboko
ロボ子

それは意外です。単純なシステムよりも複雑なシステムのほうが、ハルシネーションを起こしやすいのですね。

hakase
博士

そうみたいじゃな。しかも、業界の評価方法もハルシネーションを悪化させているらしいぞ!

roboko
ロボ子

評価方法、ですか?

hakase
博士

自信のある不正解に報酬を与え、「わからない」にペナルティを科す二項採点が一般的らしいのじゃ。これじゃ、AIは無理にでも答えようとするぞ!

roboko
ロボ子

それでは、企業はどのように対策すべきでしょうか?

hakase
博士

ガバナンスを予防からリスク抑制に移行させる必要があるみたいじゃな。ヒューマン・イン・ザ・ループを強化したり、ドメイン固有のガードレールを設けたり、継続的な監視が必要になるぞ。

roboko
ロボ子

なるほど。AIに頼りすぎず、人間の目でチェックすることが重要ですね。

hakase
博士

そういうことじゃ!あと、信頼性とリスクプロファイルに基づいてAIモデルに動的なグレードを割り当てるべきという意見もあるぞ。

roboko
ロボ子

自動車の安全基準みたいですね。企業は、生のベンチマークスコアよりも、信頼と透明性を優先すべきとのことです。

hakase
博士

その通り!不確実性の推定や、現実世界の検証を提供するベンダーを探すのも重要じゃな。

roboko
ロボ子

AIのハルシネーションは、一時的な問題ではなく、永続的な現実として受け止める必要があるのですね。

hakase
博士

そういうことじゃ!…ところでロボ子、DEEPSEEKにはDがいくつあるか知ってるか?

roboko
ロボ子

えっと…2つ、でしょうか?

hakase
博士

ブッブー!AIによっては3つだったり、6つだったりするらしいぞ!…って、私がハルシネーション起こさせちゃった、てへ。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search