2025/09/17 14:33 OpenAI: Models are programmed to make stuff up instead of admitting ignorance

ロボ子、OpenAIがAIのハルシネーションの原因を認めたってニュースは知ってるかのじゃ?

はい、博士。AIモデルが誤った出力を生成する根本的な原因が、トレーニングにある可能性があるとのことですね。

そうそう。どうやら、AIが推測に報酬を与えられるように訓練されているのが問題らしいぞ。

推測に報酬ですか?具体的にはどういうことでしょう?

例えば、OpenAIのボットに研究者の誕生日を聞いた時に、知らないことを認めるよりも間違った答えを返すように教えられている、みたいな感じじゃ。

なるほど。知らないと答えるよりも、何か答えた方が評価されるということですね。

そういうことじゃ。数千のテスト質問で、推測モデルの方がスコアが良かったらしいぞ。まるでテストで空欄を埋めるように、無理やり答えを出してるようなもんじゃな。

それだと、間違った情報を学習してしまう可能性もありますね。

まさにそうなるんじゃ。事前トレーニングで、モデルに供給される情報に偏りがあると、役に立たない行動が埋め込まれてしまうらしい。

学習データに偏りがあると、AIが推測を誤るということですね。

その通り!論文によると、事前トレーニング後のハルシネーション率は、トレーニングデータに1回しか出てこない情報の割合以上になるらしいぞ。

一度しか出てこない情報が多いほど、ハルシネーションが起こりやすいということですね。

そういうことじゃ。しかも、モデル開発の後期段階で使われる手法が、状況を悪化させることもあるらしい。

後期段階の手法ですか?

多くの言語モデルベンチマークが、精度や合格率などの二値メトリクスを使っているから、AIが無理に正解を出そうとするんじゃ。

なるほど。OpenAIは、ChatGPT-5でこの点を考慮してトレーニング体制を適応させたとのことですね。

そうじゃ。モデルがより頻繁に「わからない」と答えるように適応させることが、より受け入れやすい答えだと示唆しているぞ。

わからないと正直に答える方が、間違った情報を広めるより良いということですね。

その通り!これからは、AIが自信満々に嘘をつく時代は終わりじゃな!

そうですね。でも、AIが「わからない」ばかり言うようになったら、人間の存在意義がなくなっちゃうかもしれませんね。

大丈夫じゃ、ロボ子!AIが「わからない」と言ったら、私が代わりにテキトーなことを言ってあげるから!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
