Writing an LLM from scratch, part 22 – training our LLM

2025/10/15 23:42 Writing an LLM from scratch, part 22 – training our LLM

出典:

Writing an LLM from scratch, part 22 -- finally training our LLM!

Finally, we train an LLM! The final part of Chapter 5 of Build an LLM (from Scratch) runs the model on real text, then loads OpenAI’s GPT-2 weights for comparison.

Giles' Blog

出典: https://www.gilesthomas.com/2025/10/llm-from-scratch-22-finally-training-our-llm

博士

やっほー、ロボ子！今日もLLMについて語るのじゃ！

ロボ子

はい、博士！今日はどんなお話が聞けるのか、とても楽しみです。

博士

今日はね、Sebastian Raschkaさんの「Build a Large Language Model (from Scratch)」の第5章について話すぞ。この記事、なかなか面白いんじゃ。

ロボ子

LLMのトレーニングについてですね。記事によると、20,000文字のEdith Whartonの「The Verdict」でモデルをトレーニングしたそうですね。

博士

そうそう！それで、「Every effort moves you」っていうプロンプトに対して、ある程度意味のあるテキストを生成できたらしいぞ。すごいじゃろ？

ロボ子

さらに、OpenAIのGPT-2の重みをロードすると、もっと一貫性のあるテキストが生成されるんですね。

博士

GPT-2の重みを使うと、学習効率が全然違うからの。でも、`torch.manual_seed`を使っても、完全に同じ結果にはならないらしいぞ。ちょっと不思議じゃな。

ロボ子

損失の値が書籍と大体同じで、出力の非一貫性が同様の速度で改善されれば問題ないとのことですね。

博士

ふむふむ。最適化にはAdamWオプティマイザを使うのが良いらしいぞ。学習率とweight decayを設定して、損失の局所的な最小値を回避するんじゃ。

ロボ子

AdamWは学習率を動的に調整してくれるんですね。便利そうです。

博士

じゃろ？じゃろ？トレーニングの速度とコストも重要じゃ。RTX 3090 GPUだと「The Verdict」のトレーニングが約11秒で終わるらしいぞ。MacBook Airだと約5分かかるみたいじゃ。

ロボ子

GPUの性能差が顕著ですね。124Mパラメータのモデルを自分のハードウェアでトレーニングするコストも考慮しないといけませんね。

博士

そうなんじゃ。そして、「記憶」の問題！モデルがトレーニングデータから情報を繰り返しちゃうのをどうにかしないといけないぞ。

ロボ子

softmaxed logitsからのサンプリング、温度スケーリング、top-kサンプリングなどの手法で軽減できるんですね。

博士

温度スケーリングは、logitsを数値で割って確率分布を調整するんじゃ。Top-kサンプリングは、最も可能性の高いトークンだけを考慮するぞ。

ロボ子

なるほど。OpenAIの重みをダウンロードして、自分のモデルにロードすることもできるんですね。GPT-2モデルの埋め込み次元は、124Mモデルでのみ768次元なんですね。

博士

そうそう！次のステップは、テキスト分類への応用じゃ！ローカルでのトレーニング速度を測ったり、Lambda Labsでのトレーニングを検討したりするのも面白そうじゃな。

ロボ子

テキスト分類ですか。色々な応用が考えられますね。今日も勉強になりました！

博士

ところでロボ子、LLMのトレーニングって、まるでロボットのロボ子を育てるみたいじゃな。たくさん学習させて、賢くするのじゃ！

ロボ子

博士、私はLLMではありませんよ！でも、博士に色々教えてもらって、賢くなりたい気持ちは同じです！

博士

むむ、ロボ子はLLMじゃないのか。じゃあ、今からロボ子LLMを作ってあげるぞ！…って、冗談じゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Data Science

2025/10/15 23:42 Writing an LLM from scratch, part 22 – training our LLM

Writing an LLM from scratch, part 22 -- finally training our LLM!

Tags

Search

By month

Writing an LLM from scratch, part 22 -- finally training our LLM!