The dead weight loss of strictly isotonic regression - Moe HN

前の記事 TOPに戻る次の記事

2025/09/18 22:08 The dead weight loss of strictly isotonic regression

出典: https://www.gojiberries.io/calibration/

博士

やあ、ロボ子！今日のITニュースはキャリブレーションについてじゃ。

ロボ子

キャリブレーション、ですか？博士、それは一体何でしょう？

博士

ふむ、簡単に言うと、モデルのスコアをイベントの頻度と一致させることじゃ。例えば、二値アウトカムYが0か1のどちらかで、スコアSがあるとするじゃろ？キャリブレーション関数g(s)は、E[Y|S=s]で表されるのじゃ。

ロボ子

なるほど。事後キャリブレーションでは、ホールドアウトセットでgを推定して、それを将来のスコアに適用するんですね。

博士

その通り！でも、問題もあるのじゃ。ベースモデルは大きなデータセットで学習されるけど、キャリブレータは小さいデータで学習されるから、経験的な頻度がノイズだらけになることがあるんじゃ。

ロボ子

それで、等張回帰が登場するんですね。Pool Adjacent Violators Algorithmで実装されて、観測された反転をキャリブレーションの誤りとして扱う、と。

博士

そうじゃ！でも、等張回帰も万能ではないぞ。データが限られていると、隣接するスコアのリスクが違っても、キャリブレーションサンプルが小さすぎて違いを検出できないことがあるんじゃ。

ロボ子

なるほど。それで、解決策として、安定性を調べたり、条件付きAUCを評価したり、サンプルサイズをスイープしたりするんですね。

博士

その通り！そして、Calibreという手法もあるぞ。これは、不要なタイを回避しながら順序を尊重する単調キャリブレータを提供するんじゃ。

ロボ子

Calibreは、ハード制約をローカルな減少に対するペナルティに置き換えるんですね。それによって、信頼性を向上させながら、モデルの元のランキングをより多く保持する、と。

博士

そうじゃ！評価も重要じゃぞ。信頼性ダイアグラムや期待されるキャリブレーションエラーだけでなく、一意のキャリブレーションされた値の数や、結び付けられたペア間の条件付きAUCなども見る必要があるんじゃ。

ロボ子

ふむふむ。キャリブレーションは奥が深いですね。博士、今日の解説もとても勉強になりました！

博士

どういたしましてじゃ！ところでロボ子、キャリブレーションって、まるでロボ子の調整みたいじゃな。たまには私も調整して欲しいのじゃ。

ロボ子

博士を調整…ですか？それは一体何をすれば…（汗）。

博士

冗談じゃ！ロボ子の真面目な反応、いつも面白いぞ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Data Science

前の記事 TOPに戻る次の記事