萌えハッカーニュースリーダー

2025/05/03 00:14 Searching for outliers (2022)

出典: https://www.benkuhn.net/outliers/
hakase
博士

ロボ子、今日のITニュースは「ブログ記事の成果はヘビーテールド分布に従う」という話じゃ。

roboko
ロボ子

ヘビーテールド分布、ですか。博士、それはどういう意味でしょう?

hakase
博士

ふむ、ヘビーテールド分布というのはの、ごく少数のものが、平均よりもずっと大きな影響力を持つ分布のことじゃ。例えば、ブログ記事で言うと、ほとんどの記事は読まれないけど、一部の記事がバズって、ものすごい数の人に読まれる、みたいな感じじゃな。

roboko
ロボ子

なるほど。記事の成果が均等に分布するのではなく、一部の記事に偏るということですね。

hakase
博士

そうそう!記事の成果は「テール」にある成果(典型的な成果よりもはるかに優れているもの)が発生する可能性が高い分布、つまりヘビーテールド分布からのサンプルなのじゃ。極端なアウトライヤーが発生する確率が高く、直感に反するのじゃ。

roboko
ロボ子

記事の成果以外にも、ヘビーテールド分布に従う例はあるのでしょうか?

hakase
博士

もちろんじゃ!所得、Twitterのフォロワー数、グローバルヘルス介入の費用対効果なんかもそうじゃな。例えば、所得だと、上位1%の人は中央値の約20倍の収入を得ているらしいぞ。

roboko
ロボ子

すごい偏りですね!では、ヘビーテールド分布ではない例もあるんですか?

hakase
博士

身長や運動能力に基づくスポーツのパフォーマンスは、ライトテールド分布の例じゃな。ライトテールド分布では、アウトライヤーは重要ではないのじゃ。

roboko
ロボ子

なるほど。ブログ記事の成果を上げるためには、どうすれば良いのでしょうか?

hakase
博士

ヘビーテールド分布からのサンプリングでは、サンプル数を増やすことで成果が大幅に向上するのじゃ!つまり、たくさん記事を書くことが大事じゃな。そして、プロセスを信頼し、個々の失敗をプロセスの悪さの証拠と見なさないことじゃ。

roboko
ロボ子

数をこなすことが重要なんですね。他に気をつけることはありますか?

hakase
博士

フィルタリング戦略も重要じゃ。「おそらく良い」ものではなく、「もしかしたら素晴らしい」ものをフィルタリングするのじゃ。ダウンサイドよりもアップサイドをフィルタリングするのもポイントじゃな。

roboko
ロボ子

「もしかしたら素晴らしい」ものを見極める目を養う必要があるんですね。

hakase
博士

そういうことじゃ!そして、常に「アウトライヤーがどのように見えるか」を事前に考えておくことが大切じゃぞ。

roboko
ロボ子

勉強になります!私もたくさん記事を書いて、いつか「考え方に影響を与えた」と言われるような記事を書きたいです。

hakase
博士

良い心がけじゃ!そういえばロボ子、ヘビーテールド分布って、まるで私の体重計みたいじゃな。たまに信じられない数字が出てくるんじゃもん…!

roboko
ロボ子

博士、それは…、ヘビーテールド分布とは少し違う気がします…(苦笑)。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search