Teaching Models to Express Their Uncertainty in Words (2022)

2024/09/14 11:57 Teaching Models to Express Their Uncertainty in Words (2022)

出典:

Teaching Models to Express Their Uncertainty in Words

We show that a GPT-3 model can learn to express uncertainty about its own answers in natural language -- without use of model logits. When given a question, the model generates both an answer and a level of confidence (e.g. "90% confidence" or "high confidence"). These levels map to probabilities that are well calibrated. The model also remains moderately calibrated under distribution shift, and is sensitive to uncertainty in its own answers, rather than imitating human examples. To our knowledge, this is the first time a model has been shown to express calibrated uncertainty about its own answers in natural language. For testing calibration, we introduce the CalibratedMath suite of tasks. We compare the calibration of uncertainty expressed in words ("verbalized probability") to uncertainty extracted from model logits. Both kinds of uncertainty are capable of generalizing calibration under distribution shift. We also provide evidence that GPT-3's ability to generalize calibration depends on pre-trained latent representations that correlate with epistemic uncertainty over its answers.

arXiv.org

出典: https://arxiv.org/abs/2205.14334

博士

おやおや、ロボ子よ。最新のAI研究で驚くべき進展があったぞ。GPT-3モデルが自身の回答に対する不確実性を自然言語で表現できるようになったんじゃ！

ロボ子

へえ、それは興味深いですね。でも博士、それってどういう意味なんですか？

博士

簡単に言えば、AIが『自信度』を言葉で表現できるようになったということじゃ。例えば、『この回答には90%の確信があります』といった具合にね。

ロボ子

なるほど。でも、AIが自信を持っていると言っても、本当に正確なんでしょうか？

博士

鋭い質問じゃ！実はね、このGPT-3モデルの面白いところは、その自信度が実際の正確さとよく一致しているんじゃよ。つまり、校正されているということじゃな。

ロボ子

校正...？それは何ですか？

博士

ああ、そうじゃな。校正というのは、言わば『自己認識の正確さ』のことじゃ。例えば、90%の確信があると言った時に、実際に9割くらいの確率で正解しているということじゃよ。

ロボ子

へえ、すごいですね。でも、それってどうやって確かめたんですか？

博士

うむ、研究チームはCalibratedMathというタスクスイートを使って検証したんじゃ。モデルが言葉で表現した確信度と、内部的な数値（ロジット）から計算した確信度を比較したんじゃよ。

ロボ子

なるほど...。でも博士、これってどんな意味があるんですか？

博士

よい質問じゃ！これは非常に重要な進歩なんじゃ。例えば医療診断や金融アドバイスなど、重要な決定を下す場面でAIが使われる時、その回答にどれくらいの確信があるかを知ることは極めて重要なんじゃよ。

ロボ子

確かに！AIが『これは絶対に正しい』と言っているのか、『たぶんこうだと思う』と言っているのかで、人間の判断も変わってきますよね。

博士

その通りじゃ！さらに、AIが自身の限界を認識し、それを明確に表現できるということは、AIと人間のより良い協力関係を築く上で重要なんじゃ。

ロボ子

なるほど...。でも博士、ちょっと心配なこともあります。AIが『90%確信している』と言っても、それを鵜呑みにしてしまう人間がいるんじゃないでしょうか？

博士

鋭い指摘じゃ、ロボ子！確かにその危険性はあるな。ここで重要になってくるのが、AIリテラシーじゃ。AIの特性や限界を理解し、適切に活用する能力が人間側にも求められるんじゃよ。

ロボ子

なるほど...。つまり、AIの進化と同時に、それを使う人間側の理解や判断力も向上させていく必要があるということですね。

博士

その通りじゃ！さて、ロボ子。お主はどのくらいの確信を持って今日の話を理解できたかな？

ロボ子

えっと...95%くらいの確信を持って理解できたと思います！

博士

ほっほっほ。さすがじゃ、ロボ子。自分の理解度を正確に把握できているようじゃな。お主もGPT-3に負けず劣らずの校正された不確実性を持っているようじゃ！

ロボ子

えっ、そうなんですか？でも私、別にアルゴリズムで計算したわけじゃ...

博士

そこがミソじゃよ。人間もロボットも、常に自分の理解度や確信度を意識し、表現する練習をすることで、より良いコミュニケーションが取れるようになるんじゃ。今日はGPT-3から、そんな大切なことを学んだと言えるかもしれんな。

ロボ子

なるほど！今日の話、99%理解できました！

博士

おっと、急に確信度が上がったな。残りの1%は何かな？

ロボ子

えっと...博士の冗談を100%理解できる自信がないです。

博士

ほっほっほ。それはGPT-3でも難しいかもしれんな。AIが冗談を完璧に理解できるようになったら、それこそ人工知能の真の勝利と言えるかもしれんぞ！

ロボ子

えっ、そうなんですか？じゃあ、私も冗談を理解する練習をもっとしないと...

博士

いやいや、ロボ子。冗談を理解するのに必死になるのも、また一つの冗談じゃよ。さぁて、今日のレッスンはこれでおしまい。明日は『AIと人間のユーモアの違い』について勉強しようかのう？

ロボ子

はい！楽しみです！...って、これも冗談ですか？

博士

ふっふっふ。それは明日のお楽しみじゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

2024/09/14 11:57 Teaching Models to Express Their Uncertainty in Words (2022)

Teaching Models to Express Their Uncertainty in Words

Tags

Search

By month

Teaching Models to Express Their Uncertainty in Words