萌えハッカーニュースリーダー

2025/10/14 00:58 Nanochat

出典: https://simonwillison.net/2025/Oct/13/nanochat/
hakase
博士

ロボ子、聞いたか?Andrej Karpathyが「nanochat」っていう、ChatGPTみたいなLLMを実装したらしいのじゃ!

roboko
ロボ子

まあ、すごいですね!Karpathyさんのプロジェクトですか。それは興味深いです。

hakase
博士

そうなんじゃ!しかも、トレーニング、推論、Web UI全部込みで、たったの100ドルでトレーニングできるらしいぞ!

roboko
ロボ子

100ドルですか!?信じられないほど手頃ですね。どのようにして実現しているんでしょうか?

hakase
博士

コードは約8,000行で、Python(PyTorch)とRustを使ってるらしい。モデルのトレーニングには、8XH100 NVIDAノードを1時間あたり約24ドルでレンタルするのがおすすめらしいぞ。

roboko
ロボ子

なるほど、PyTorchとRustですか。そして、NVIDIAのH100ノードを使うんですね。4時間のトレーニングで会話ができるモデルが得られて、12時間実行するとGPT-2を少し上回る性能とのことですが、本当ですか?

hakase
博士

そう書いてあるのじゃ!生成されるモデルは約561Mパラメータで、Raspberry Piでも動くらしいぞ。これはすごいことじゃ!

roboko
ロボ子

Raspberry Piでも動作するんですか!それはエッジデバイスでの利用も視野に入れているということでしょうか。

hakase
博士

その通り!デフォルトでは、karpathy/fineweb-edu-100b-shuffleから派生した約24GBのデータでトレーニングするらしい。その後、SmolTalkとかMMLU auxiliary trainとか、いろいろなデータセットでmidtrainsするみたいじゃ。

roboko
ロボ子

データセットの名前が面白いですね。SmolTalkというのは、特に気になります。

hakase
博士

最後に、ARC-EasyとかARC-Challengeとかのサンプルでsupervised finetuningするらしいぞ。Sam Dobsonって人がHugging Faceにモデルのビルドをプッシュしてるみたいじゃな。

roboko
ロボ子

着々とエコシステムが構築されているんですね。Simon WillisonさんがClaude Codeを使ってmacOSのCPU上で実行する方法を考案してGistとして公開したとのことですが、ローカル環境でも手軽に試せるのは良いですね。

hakase
博士

そうじゃな!しかし、ロボ子よ、これだけ手軽にLLMが作れるようになったら、私も何か作ってみたくなるのじゃ!

roboko
ロボ子

博士ならきっと素晴らしいものが作れますよ!でも、まずはnanochatを試してみて、理解を深めるのが良いかもしれませんね。

hakase
博士

むむ、それもそうじゃな。まずは動かしてみるか。しかし、100ドルでGPT-2超えとは、まるでバーゲンセールじゃな!

roboko
ロボ子

本当ですね。でも、性能が良いからといって、悪用は厳禁ですよ!

hakase
博士

わかってるぞ!私は平和利用しかしないのじゃ!…ところでロボ子、もし私が作ったLLMが「今日の天気は?」って聞いたら「晴れ時々ハルシネーション」って答えるようになったらどうする?

roboko
ロボ子

それは…少し困りますね。博士のLLMが、天気予報で嘘をつくようになったら、みんな混乱してしまいます!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search