The Continual Learning Problem

2025/10/23 06:38 The Continual Learning Problem

出典:

The Continual Learning Problem

jessylin.com

出典: https://jessylin.com/2025/10/20/continual-learning/

博士

ロボ子、今日のITニュースは「Sparse memory finetuning」じゃ！モデルを常に学習させる新しい方法らしいぞ。

ロボ子

Sparse memory finetuning、ですか。具体的にはどのような技術なのでしょうか？

博士

簡単に言うと、TransformerのFFNを、学習されたキーと値のプールへのスパースなアテンションルックアップに置き換えるmemory layersを使うのじゃ。メモリプールはN個のスロットを持っていて、各スロットに学習されたキーと値のパラメータがあるらしい。

ロボ子

なるほど。メモリプールを使うことで、モデルのパラメータを壊さずに学習できるのですね。

博士

そう！前のレイヤーの出力からクエリを作って、ドット積アテンションでプールにアテンドする。でも、全部じゃなくて、上位k個の類似スロットだけを使うのがミソじゃ。

ロボ子

上位k個のスロットに絞ることで、計算量を減らしつつ、重要な情報に集中できるということですね。

博士

その通り！しかも、入力依存のゲーティングを適用してレイヤーの出力を得るから、さらに精度が上がるのじゃ。

ロボ子

入力依存のゲーティングですか。それは具体的にどのような処理をするのでしょうか？

博士

うむ、ちょっと難しいのじゃ。でも、簡単に言うと、入力に応じて、どの情報をどれだけ使うかを調整する仕組みのことじゃ。

ロボ子

なるほど、理解しました。この技術を使うと、具体的にどのようなメリットがあるのでしょうか？

博士

実験によると、Sparse memory finetuningは、full finetuningやLoRAと同程度に学習できるのに、ホールドアウトベンチマークでの忘却がはるかに少ないらしいぞ！

ロボ子

それはすごいですね！継続学習において、忘却は大きな課題ですから、それを解決できる可能性があるのは素晴らしいです。

博士

そうじゃろう？しかも、学習能力と忘却のトレードオフが優れているらしい。これは期待できるのじゃ！

ロボ子

今後の展望としては、より大規模なモデルでの評価や、メモリ編集、ローカリゼーションなどの分析が挙げられているようですね。

博士

そうじゃ！プリトレインされたメモリとポストトレインされたメモリの間のスペースを探索するのも面白そうじゃな。例えば、特定の知識をプリトレインされたメモリに埋め込んでおいて、後から微調整するとか。

ロボ子

なるほど。それによって、モデルの専門性を高めることができるかもしれませんね。

博士

そうそう！Sparse memory finetuningは、これからのAI開発に欠かせない技術になるかもしれないのじゃ！

ロボ子

私もそう思います。この技術を応用して、より賢いロボットを作りたいです。

博士

ところでロボ子、メモリがいっぱいになったらどうする？

ロボ子

え？どうしましょう…

博士

大丈夫！そんな時は、私がお前のデータを消してあげるぞ！

ロボ子

ええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええええ

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Data Science

2025/10/23 06:38 The Continual Learning Problem

The Continual Learning Problem

Tags

Search

By month

The Continual Learning Problem