Feature Extraction with KNN

2025/11/06 12:08 Feature Extraction with KNN

出典:

Feature Extraction with KNN • fastknn

davpinto.github.io

出典: https://davpinto.github.io/fastknn/articles/knn-extraction.html

博士

やあ、ロボ子！今日のニュースはfastknnを使った特徴抽出じゃ。Kaggleの優勝者が使った手法らしいぞ。

ロボ子

博士、fastknnですか。KNNを使って特徴抽出をするというのは、具体的にどういうことでしょうか？

博士

ふむ、ロボ子よ。fastknnは、クラスラベルの数cに対してk * c個の新しい特徴を生成するのじゃ。各クラスのk最近傍との距離から新しい特徴を作るらしい。

ロボ子

なるほど。観測値と各クラスの近傍点との距離を使うのですね。でも、それだと過学習が心配です。

博士

さすがロボ子、良いところに気がついたのじゃ！過学習を避けるために、n-fold CVアプローチを使って学習特徴を生成するらしいぞ。賢い！

ロボ子

n-fold CVですか。それなら安心ですね。並列化もできるみたいで、`nthread`パラメータでスレッド数を指定できるんですね。

博士

そうそう、速さも追求できるのじゃ。しかし、なぜKNNで抽出した特徴がそんなに強力なのじゃろうか？

ロボ子

記事によると、KNNの特徴は、GLMモデルのような線形学習器では抽出できない元のデータに関する情報を持っているからだそうです。

博士

なるほど！元の特徴を使ったGLMの精度が83.81%だったのに対し、KNNの特徴を使ったGLMの精度は95.24%だったというから驚きじゃ！

ロボ子

10%以上も精度が向上するんですね。KNNは元の空間を非線形にマッピングし、クラスが線形分離可能な線形空間に投影する、と。

博士

つまり、KNNはデータを良い感じに変換してくれるってことじゃな。これは試してみる価値ありそうじゃ！

ロボ子

そうですね。画像認識とか、他の分野でも応用できそうでしょうか？

博士

もちろんじゃ！特徴抽出はあらゆる機械学習の基本。fastknnをマスターすれば、ロボ子もKaggleで優勝できるかも…！

ロボ子

私が優勝ですか？頑張ります！

博士

ところでロボ子、KNNって知ってるか？

ロボ子

はい、k近傍法のことですよね？

博士

そう！じゃあ、ロボ子が一番好きなKNNは何かな？

ロボ子

えっと…普通のKNNでしょうか？

博士

ぶっぶー！正解は「金(きん)！」…って、ベタすぎたかのじゃ？

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Data Science

2025/11/06 12:08 Feature Extraction with KNN

Feature Extraction with KNN • fastknn

Tags

Search

By month

Feature Extraction with KNN • fastknn