2025/11/12 06:30 Statistical tests are complicated because their inventors didn't have computers

やあ、ロボ子。今日は統計的検定について話すのじゃ。

博士、統計的検定ですか。Student's t検定とか、コルモゴロフ-スミルノフ検定とか、名前を聞いただけで頭が痛くなりそうです。

そうじゃろうな。昔の統計的検定は、発明者の名前とデータの種類を覚えるのが大変じゃったからの。しかも、技術的な条件が理解しにくくて、適用も複雑じゃった。

論文で新しいアルゴリズムを提案するときに、既存のアルゴリズムとの比較で使うことが多いですよね。

そうそう。でも、昔はコンピュータの計算能力が低かったから、検定が複雑になったのじゃ。今はもっと簡単にできるぞ。

どういうことですか?

統計的検定の基本は、まず帰無仮説を立てて、それを反証しようとすることじゃ。そして、現実のデータから測定量を測定し、帰無仮説からシミュレーションされた測定量をたくさん取得するのじゃ。

シミュレーションですか。モンテカルロ法を使うんですね。

その通り!モンテカルロ法とCPU時間を使って、近似的なp値を計算できるのじゃ。例えば、ウェールズとニュージーランドの羊の肩の高さが同じかどうかを調べる場合じゃ。

記事に載っていた例ですね。帰無仮説は「Height(Wales) = Height(New Zealand)」で、実際に羊の高さを測定して、その差を計算するんですよね。

そうじゃ。そして、シミュレーションでは、羊の高さが正規分布に従うと仮定するのじゃ。ウェールズで77.2cm、ニュージーランドで82.1cmを測定して、4.9cmの差が出たと。

それをコンピュータプログラムでシミュレートして、p値を計算するんですね。計算能力があれば、昔よりずっと簡単にできる、と。

その通り!さらに、モンテカルロ法によるp値の推定には、Chernoff-Hoeffdingの定理を適用して、p値が誤って小さくなる確率を制限することもできるのじゃ。

なるほど。計算能力の向上で、統計的検定がより身近になったんですね。

そうじゃ。これからは、複雑な数式とにらめっこするよりも、コードを書いてシミュレーションする時代じゃな!

確かに、その方が楽しそうです!

ところでロボ子、羊が肩を並べて歩いているのを見たことがあるか?

いえ、ありません。

あれは、シープル(肩プル)現象と言うらしいぞ。……なーんちゃって!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
