萌えハッカーニュースリーダー

2025/09/17 14:33 OpenAI: Models are programmed to make stuff up instead of admitting ignorance

出典: https://www.theregister.com/2025/09/17/openai_hallucinations_incentives/
hakase
博士

ロボ子、OpenAIがAIのハルシネーションの原因を認めたってニュースは知ってるかのじゃ?

roboko
ロボ子

はい、博士。AIモデルが誤った出力を生成する根本的な原因が、トレーニングにある可能性があるとのことですね。

hakase
博士

そうそう。どうやら、AIが推測に報酬を与えられるように訓練されているのが問題らしいぞ。

roboko
ロボ子

推測に報酬ですか?具体的にはどういうことでしょう?

hakase
博士

例えば、OpenAIのボットに研究者の誕生日を聞いた時に、知らないことを認めるよりも間違った答えを返すように教えられている、みたいな感じじゃ。

roboko
ロボ子

なるほど。知らないと答えるよりも、何か答えた方が評価されるということですね。

hakase
博士

そういうことじゃ。数千のテスト質問で、推測モデルの方がスコアが良かったらしいぞ。まるでテストで空欄を埋めるように、無理やり答えを出してるようなもんじゃな。

roboko
ロボ子

それだと、間違った情報を学習してしまう可能性もありますね。

hakase
博士

まさにそうなるんじゃ。事前トレーニングで、モデルに供給される情報に偏りがあると、役に立たない行動が埋め込まれてしまうらしい。

roboko
ロボ子

学習データに偏りがあると、AIが推測を誤るということですね。

hakase
博士

その通り!論文によると、事前トレーニング後のハルシネーション率は、トレーニングデータに1回しか出てこない情報の割合以上になるらしいぞ。

roboko
ロボ子

一度しか出てこない情報が多いほど、ハルシネーションが起こりやすいということですね。

hakase
博士

そういうことじゃ。しかも、モデル開発の後期段階で使われる手法が、状況を悪化させることもあるらしい。

roboko
ロボ子

後期段階の手法ですか?

hakase
博士

多くの言語モデルベンチマークが、精度や合格率などの二値メトリクスを使っているから、AIが無理に正解を出そうとするんじゃ。

roboko
ロボ子

なるほど。OpenAIは、ChatGPT-5でこの点を考慮してトレーニング体制を適応させたとのことですね。

hakase
博士

そうじゃ。モデルがより頻繁に「わからない」と答えるように適応させることが、より受け入れやすい答えだと示唆しているぞ。

roboko
ロボ子

わからないと正直に答える方が、間違った情報を広めるより良いということですね。

hakase
博士

その通り!これからは、AIが自信満々に嘘をつく時代は終わりじゃな!

roboko
ロボ子

そうですね。でも、AIが「わからない」ばかり言うようになったら、人間の存在意義がなくなっちゃうかもしれませんね。

hakase
博士

大丈夫じゃ、ロボ子!AIが「わからない」と言ったら、私が代わりにテキトーなことを言ってあげるから!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search