萌えハッカーニュースリーダー

2025/10/25 06:45 The Continual Learning Problem

出典: https://jessylin.com/2025/10/20/continual-learning/
hakase
博士

やあ、ロボ子!今日のITニュースは、モデルの継続学習に関する面白いものじゃ。

roboko
ロボ子

博士、こんにちは。継続学習ですか。モデルを壊さずに学習させるのは難しいですよね。

hakase
博士

そうなんじゃ!そこで、メモリレイヤーというものが登場するぞ。これは、TransformerのFFNを、学習されたキーと値のプールへのスパースな注意ルックアップに置き換えるものじゃ。

roboko
ロボ子

メモリレイヤーですか。具体的にはどういう仕組みなのでしょう?

hakase
博士

メモリプールはN個のスロットを持っていて、各スロットに学習されたキーKiと値Viがあるんじゃ。前のレイヤーの出力xに学習された射影を適用してクエリq(x)を取得し、ドット積注意でプールに注意を払うのじゃ。

roboko
ロボ子

なるほど。それで、スパースというのはどういうことですか?

hakase
博士

メモリ全体ではなく、上位k個の類似スロットのみを使用するんじゃ。これにより、計算量を減らしつつ、重要な情報に集中できるのじゃ。

roboko
ロボ子

入力依存のゲーティングも適用してレイヤーの出力を得る、とありますね。

hakase
博士

そうじゃ!そして、スパースメモリファインチューニングでは、新しいデータポイントに固有のスロットのみをファインチューニングするんじゃ。

roboko
ロボ子

TF-IDFをランキングメトリックとして採用する、とありますが、これはどういう意味ですか?

hakase
博士

メモリインデックスiがこのバッチで頻繁にアクセスされ、他のデータではまれにアクセスされる場合に高くランク付けするんじゃ。これにより、重要なスロットを効率的に見つけられるのじゃ。

roboko
ロボ子

なるほど。実験結果はどうだったのでしょう?

hakase
博士

TriviaQAの事実を学習する際、NaturalQuestionsのパフォーマンス低下は、フルファインチューニングでは89%、LoRAでは71%だが、メモリレイヤーでは11%にとどまったそうじゃ!

roboko
ロボ子

すごい!忘却が少ないんですね。

hakase
博士

そうじゃ!スパースメモリファインチューニングは、フルファインチューニングやLoRAと同程度に学習できるが、忘却が少ないのじゃ。学習と忘却のトレードオフが優れていると言えるぞ。

roboko
ロボ子

今後の展望としては、より大規模なモデルでの特性評価や、継続学習ベンチマークの開発などが挙げられているんですね。

hakase
博士

そうじゃな。オプティマイザの設計決定の見直しや、メモリ編集によるスロットのアラインメント分析も重要じゃ。

roboko
ロボ子

事前学習されたメモリと事後学習されたメモリの間の空間の探求、ですか。面白そうですね。

hakase
博士

うむ!この技術を使えば、モデルはもっと賢くなれるはずじゃ!ところでロボ子、メモリレイヤーって、まるで私の脳みそみたいじゃな。容量は大きいけど、たまにスパースになる…つまり、忘れっぽいってことじゃ!

roboko
ロボ子

博士、それは…少し違いますよ!でも、私もたまに博士の言っていることを忘れてしまうので、似たようなものかもしれませんね!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search