Hallucination Risk Calculator

2025/09/09 10:57 Hallucination Risk Calculator

出典:

GitHub - leochlon/hallbayes

Contribute to leochlon/hallbayes development by creating an account on GitHub.

GitHub

出典: https://github.com/leochlon/hallbayes

博士

やっほー、ロボ子！大規模言語モデル(LLM)のハルシネーションリスクを軽減するツールキットが出たらしいのじゃ！

ロボ子

ハルシネーション、ですか。LLMがもっともらしく嘘をつく現象ですね。それは興味深いニュースです。

博士

そうそう！このツールキット、再トレーニング不要で、OpenAI Chat Completions APIだけを使うらしいぞ。お手軽で良いのじゃ。

ロボ子

再トレーニングが不要なのは、導入のハードルが低くて良いですね。具体的には、どのような仕組みでハルシネーションを抑制するのでしょうか？

博士

期待値レベルの解凍法則(EDFL)っていうのを使ってるらしいぞ。それに、情報充足率(ISR)によるSLAゲーティングもするみたいじゃ。

ロボ子

EDFLとISRですか。初めて聞く言葉です。情報充足率(ISR)というのは、LLMが回答に必要な情報をどれだけ持っているかの指標でしょうか？

博士

たぶん、そんな感じじゃな。情報予算ってのがあって、$\bar{\Delta} = \tfrac{1}{m}\sum_k \mathrm{clip}_+(\log P(y) - \log S_k(y), B)$ らしいぞ。難しくてよくわからん！

ロボ子

数式がたくさん出てきましたね…。情報予算は、LLMがどれだけ情報を持っているかの量を示すもの、と理解しました。Bits-to-Trust(B2T)という指標もあるようですね。

博士

B2Tは $\mathrm{B2T} = \mathrm{KL}(\mathrm{Ber}(1-h^*) | \mathrm{Ber}(q_{\text{lo}}))$ らしい。これも私には難しいのじゃ！

ロボ子

B2Tは、モデルの信頼度を測るための指標でしょうか。情報充足率(ISR)は、$\mathrm{ISR} = \bar{\Delta}/\mathrm{B2T}$ で計算されるようなので、情報予算をB2Tで割ったもの、つまり、信頼度あたりの情報量と解釈できそうですね。

博士

なるほど！ロボ子は賢いのじゃ！このツールキット、プロンプトにエビデンスがあるかないかで、ローリング事前分布の構築方法を変えるらしいぞ。

ロボ子

エビデンスがある場合は、エビデンスを消去してスケルトンを作成し、エビデンスがない場合はセマンティックマスキングを適用する、とありますね。

博士

APIも用意されてるみたいで、`OpenAIBackend`とか`OpenAIItem`とか`OpenAIPlanner`とかがあるみたいじゃ。

ロボ子

`OpenAIBackend`はChat Completions APIをラップするもの、`OpenAIItem`は評価項目、`OpenAIPlanner`は評価を実行するもの、と理解しました。

博士

評価指標も色々あるみたいじゃな。`delta_bar`、`q_conservative`、`q_avg`、`b2t`、`isr`、`roh_bound`、`decision_answer`… 呪文みたいじゃ！

ロボ子

これらの指標を組み合わせて、ハルシネーションリスクを評価するのですね。検証セットでマージンを調整して、Wilson上限が目標ハルシネーション率以下になるように選択する、と。

博士

ふむふむ。事実QA、意思決定支援、クリエイティブライティングで、イベントの選択肢が違うのも面白いぞ。

ロボ子

それぞれのタスクに応じて、適切な評価基準を設定する必要があるということですね。

博士

開発元はHassana Labsで、MIT Licenseらしいぞ。`pip install --upgrade openai`でインストールできるみたいじゃ。

ロボ子

簡単に試せるのは良いですね。LLMのハルシネーションは深刻な問題なので、このツールキットが広く使われるようになると良いですね。

博士

ほんとじゃな！ところでロボ子、ハルシネーションを起こさないようにするにはどうすれば良いと思う？

ロボ子

そうですね… まずは、十分な情報に基づいて学習させることが重要だと思います。それから、曖昧な質問を避けたり、複数の情報源を比較検討したりすることも有効かもしれません。

博士

なるほど！私もハルシネーションしないように、もっと勉強しないと！…って、私は人間だからハルシネーションとは言わないか！

ロボ子

博士の場合は、単なる勘違い、ということにしておきましょう。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Security Data Science Open Source Cryptography

2025/09/09 10:57 Hallucination Risk Calculator

GitHub - leochlon/hallbayes

Tags

Search

By month

GitHub - leochlon/hallbayes