Reproducing the deep double descent paper

2025/06/05 18:34 Reproducing the deep double descent paper

出典:

reproducing deep double descent

This summer, I've been at the intensively trying to catch up to the current state of the machine learning world. I don't have any prior background in ML, so...

stephen wan

出典: https://stpn.bearblog.dev/reproducing-double-descent/

博士

ロボ子、今日はDeep Double Descent現象について話すのじゃ！

ロボ子

Deep Double Descent現象ですか。初めて聞きます。どんな現象なのですか？

博士

モデルサイズが大きくなるにつれて、テストエラーが一時的に悪化して、その後再び改善する現象のことじゃ。

ロボ子

エラーが一時的に悪化するなんて、不思議ですね。

博士

そうじゃろ？モデルが過学習する段階でエラーが悪化するらしいのじゃ。でも、モデルサイズがさらに大きくなると、過学習を克服してエラーが再び減少するのじゃ。

ロボ子

なるほど。今回の実験では、ResNet18モデルを使って、モデルサイズとラベルノイズを変えてテストエラーの変化を観察したのですね。

博士

その通り！モデルサイズは7段階、ラベルノイズは0%, 10%, 20%で試したみたいじゃ。

ロボ子

ラベルノイズがない場合は、Double Descentは見られなかったのですね。

博士

そうなんじゃ。10%と20%のラベルノイズがある場合にDouble Descentが確認されたみたいじゃぞ。

ロボ子

10%のノイズでは、モデルサイズが中程度の時に性能が一時的に悪化したとのことですが、20%のノイズではどうだったのですか？

博士

20%のノイズでは、モデルサイズが大きくなっても初期の性能を超えられない場合があったみたいじゃ。

ロボ子

なるほど。ラベルノイズが多いと、Double Descentの効果が出にくいのかもしれませんね。

博士

今回の実験では、PyTorchのResNet18をそのまま使えなくて、モデルの構造を調整する必要があったみたいじゃな。

ロボ子

ResNet18はImageNet向けに設計されているから、CIFAR-10データセットに合わせて調整が必要だったのですね。

博士

そうそう。それと、テストエラーの計算方法の解釈に誤りもあったみたいじゃ。% accuracyとcross-entropy lossの違いを理解する必要があるのじゃ。

ロボ子

Deep Double Descent現象は、実務でどのように応用できるのでしょうか？

博士

モデルのサイズを大きくすることで、過学習を抑えつつ性能を向上させることができる可能性があるのじゃ。特に、ノイズが多いデータセットで有効かもしれないぞ。

ロボ子

なるほど。モデルのサイズを大きくする際には、計算リソースも考慮する必要がありそうですね。

博士

その通りじゃ！ロボ子、今日はよく頑張ったのじゃ！

ロボ子

ありがとうございます、博士。ところで、Double Descent現象って、まるでジェットコースターみたいですね。

博士

確かに！性能が上がったり下がったりするなんて、ジェットコースターみたいじゃな。でも、最後は笑顔でゴールできると信じて、研究を頑張るのじゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Programming Data Science Computer Vision

2025/06/05 18:34 Reproducing the deep double descent paper

reproducing deep double descent

Tags

Search

By month

reproducing deep double descent