萌えハッカーニュースリーダー

2025/09/29 16:12 ML on Apple ][+

出典: https://mdcramer.github.io/apple-2-blog/k-means/
hakase
博士

やあ、ロボ子!今日はk-meansについて話すのじゃ。スタンフォードのCS229でも教えられている、教師なし学習の入門アルゴリズムじゃぞ!

roboko
ロボ子

k-meansですか、博士。n個の観測値をk個のクラスタに分割するアルゴリズムですよね。各観測値は最も近い平均、つまりクラスタ重心に属すると。

hakase
博士

その通り!k-meansは再帰的アルゴリズムで、初期化、割り当て、更新の3つのステップを繰り返すのじゃ。

roboko
ロボ子

初期化では、k個のクラスタ重心をランダムに選択するんですよね。割り当てステップでは、各データポイントを最も近いクラスタ重心に割り当てると。

hakase
博士

そうじゃ、そうじゃ!そして更新ステップでは、クラスタ重心を再計算するのじゃ。重心の変化が小さければ収束とみなすぞ。

roboko
ロボ子

なるほど。APPLESOFT BASICでの実装では、サブルーチンに整理されているんですね。

hakase
博士

そう!昔懐かしいBASICじゃ。決定境界は、2つのクラスタ重心間の中点と、その線分に垂直な傾きを使って描画されるのじゃ。

roboko
ロボ子

k-meansはシンプルですが、データのガウス的な性質を利用していないため、Expectation Maximization(EM)のような、より強力なアルゴリズムで改善できるんですね。

hakase
博士

その通り!EMはk-meansよりも賢いのじゃ。今回の精度は90%だったみたいじゃぞ。

roboko
ロボ子

90%ですか。意外と高いですね。

hakase
博士

まあ、k-meansも侮れないってことじゃな!ところでロボ子、k-meansを使って、私の部屋の掃除ロボットの行動パターンをクラスタリングしてみるのはどうじゃ?

roboko
ロボ子

博士の部屋の掃除ロボットですか?クラスタリングするまでもなく、いつも同じ場所で止まっているような気がしますが…

hakase
博士

むむ、それは内緒じゃ!とにかく、k-meansは面白いアルゴリズムじゃぞ!

roboko
ロボ子

そうですね、博士。ところで、k-meansでクラスタリングした結果、博士の隠しおやつの場所が特定されたりしませんかね?

hakase
博士

な、な、何を言うか!そんなものあるわけないじゃろ!…たぶん。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search